Netflix выбирает фильмы и даже картинки, которые понравятся лично вам. В компании рассказали как

28 декабря, 2017 четверг
14:21

В кинокомпании Netflix рассказали, каким образом они применяют "индивидуальный подход" к каждому пользователю, и предлагают "выигрышный" набор фильмов, сериалов и даже картинок к ним

Об этом говорится в материале Medium.

Одна из главных отличительных черт Netflix - система персонализации рекомендаций. Благодаря ей каждый пользователь видит на главной странице в первую очередь те фильмы и сериалы, которые могут его заинтересовать.

null

Недавно в попытках улучшить этот опыт сервис начал выбирать и обложки для контента, которые больше понравятся конкретному зрителю.

Как это работает

"Предложить соответствующий контент - не единственная задача Netflix. Сервис должен заинтересовать пользователя, показать ему, что фильм или сериал отвечает его интересам и его стоит посмотреть", - рассказывают в компании.

Для этого была создана персонализация обложек. Они дают визуальное "доказательство", что продукт будет интересен: например, на них может быть изображен актер, который нравится зрителю, или драматический момент, который передает суть контента.

null

Ранее на Netflix каждому фильму и сериалу отвечала одна обложка. Какая именно - выбиралось по интересам зрителей: ставили ту, на которую больше раз "кликали". Но теперь разным пользователям демонстрируют разные изображения, в зависимости от их предпочтений.

Например, если человек до этого смотрел романтические фильмы, то ему больше подойдет обложка "Умницы Уилла Хантинга", на которой изображены Мэтт Дэймон и Минни Драйвер. А тот, кто любит комедии, скорее всего нажмет на картинку с Робином Уильямсом - известным комедийным актером.

null

Разумеется, реальные сценарии использования обычно сложнее, поэтому правила персонализации создаются с помощью алгоритмов на основе пользовательских данных.

Сложности

На Netflix почти весь пользовательский контент контролируется алгоритмами: контент показывается на главной странице, в каком порядке, какие сообщения приходят пользователю и так далее.

И у каждого аспекта персонализации есть свои сложности. Одна из проблем персонализации обложек - пользователю можно показать только одно изображение за раз. В случае с контентом зрителю предлагают сразу несколько вариантов, и из того, что человек выбирает, следуют выводы о его предпочтениях.

null

Но обложки демонстрируются по одной, так что сделать вывод о вкусах пользователя действий не получится. Netflix необходимо знать, в каком случае само изображение спровоцировало зрителя на просмотр, а в каком он включил бы видео независимо от обложки. Поэтому различные алгоритмы рекомендаций должны тесно взаимодействовать друг с другом.

Еще одна сложность - понять, насколько сильно влияет изменение обложки продукта на поиск объекта. Мешает новая обложка снова найти окошко на странице, если человек захотел его посмотреть? Решает ли пользователь включить сериал потому, что обложка изменилась на более интересную?

Очевидно, что нужно всегда показывать наиболее подходящую картинку, но частая смена обложки может запутать человека и помешать определить, какое именно изображение привлекло его внимание к продукту.

Кроме этого, для эффективной работы алгоритма необходим значительный пул обложек для каждого продукта. Они должны демонстрировать разные стороны фильма или сериала, но не вводить зрителя в заблуждение и не быть "кликабельными".

Наконец, существуют еще и технические сложности: 20 миллионов запросов в секунду должны обрабатываться с низкой задержкой.

Метод "контекстных бандитов"

Большая часть "двигателя" рекомендаций Netflix построена на алгоритмах машинного обучения. Алгоритмы анализируют информацию о том, как зрители используют сервис, а затем эффективность новых алгоритмов проверяют с помощью A / B-тестов.

null

Зрители в группе А продолжают пользоваться старыми системами, а группа B получает новые. Если через некоторое время привлечение подписчиков в группе B вырастает, то алгоритм распространяется на всю базу пользователей.

Но такой подход генерирует потери: пока проходит тестирование, огромная группа зрителей не получает контент с собственными предпочтениями.

Чтобы уменьшить потери, Netflix перешел с обучения на пакетах данных на онлайн-обучение. Для персонализации обложек используется система контекстных бандитов (contextual bandits) - программ, которые обучаются методом проб и ошибок.

Вместо того, чтобы ждать новые базы данных и завершение A / B-теста, контекстные бандиты определяют оптимальную обложку для каждого отдельного пользователя и контекста.

Главная задача контекстных бандитов - минимизировать потери. Данные для обучения бандитов генерируются с помощью контролируемой случайной выдачи: зрителям показывают случайно выбранные обложки фильмов и сериалов, а система записывает их поведение. Этот процесс называется "исследование данных".

Как выбирают изображения

Контекстные бандиты выбирают лучшие обложки исходя из контекста - совокупности признаков, в зависимости от которых модель корректирует свое поведение.

Признаками могут быть много данных о пользователе: на какие фильмы он кликал раньше, в каком жанре, с каким продуктом и как он взаимодействовал, страна проживания, язык, устройство, время суток и день недели.

Для определения лучшей обложки также используется число привлечений (take rates) - количество кликов на продукт, поделенное на количество просмотров обложки.

После того, как система научилась, она ранжирует обложки отдельно для каждого контекста. Алгоритм предусматривает вероятность клика пользователя на каждую обложку в каждом контексте и демонстрирует зрителю ту, с которой эта вероятность выше.

Читайте также: Все говорят об искусственном интеллекте Простыми словами объясним, что это

Теги:
Киев
+8°C
  • Киев
  • Львов
  • Винница
  • Днепр
  • Донецк
  • Житомир
  • Запорожье
  • Ивано-Франковск
  • Кропивницкий
  • Луганск
  • Луцк
  • Николаев
  • Одесса
  • Полтава
  • Ровно
  • Сумы
  • Симферополь
  • Тернополь
  • Ужгород
  • Харьков
  • Херсон
  • Хмельницкий
  • Черкасси
  • Черновцы
  • Чернигов
  • USD 38.99
    Покупка 38.99
    Продажа 39.5
  • EUR
    Покупка 42.18
    Продажа 42.91
  • Актуальное
  • Важное