Газета.Ru в Telegram
Новые комментарии +

У каждого пользователя своя ценность: раскрыт алгоритм TikTok

Механизм работы TikTok раскрыт газетой The New York Times

Американская газета The New York Times раскрыла внутренний документ, который описывает, как работают рекомендации приложения: оценивается не только реакция пользователей на видео, но и то, чем юзеры делятся в личных сообщениях, а также «доходность» роликов.

TikTok – это бесконечный поток видео и, в отличие от других соцсетей, которые он все больше вытесняет, служит больше для развлечения, чем для связи с друзьями. Он преуспел там, где другие приложения для потерпели неудачу, отчасти потому, что он упрощает создание контента, давая пользователям фоновую музыку для танцев или мемы для повторения.

Но в большей степени благодаря работе своих алгоритмов рекомендаций.

Для многих пользователей, которые потребляют, не создавая, контент, приложение работает, как настоящий медиум: оно потрясающе точно умеет считывать наши предпочтения и направлять нас к одной из своих многочисленных «сторон», независимо от того, интересуетесь ли вы политикой, пользованием Excel или жизнью конкретной знаменитости.

Под влиянием общественности, желающей знать, как именно работают алгоритмы, сервис уже публично делился общими схемами своей системы рекомендаций. По словам представителей TikTok, нейросеть подбирает контент на основе информации, которую пользователь о себе предоставил, а также лайков, шеров, репостов и комментариев

Сторонние аналитики также пытались взломать его код.

Летом The Wall Street Journal выяснил, что TikTok в значительной степени ориентируется на то, сколько времени вы тратите на просмотр каждого видео, чтобы показать вам еще больше роликов, которые заставят прокручивать ленту дальше.

Этот процесс иногда может привести молодых зрителей в опасные кроличьи норы, в частности, к контенту, который подстрекает к самоубийству или членовредительству – проблемы, которые TikTok пытается решить, агрессивно удаляя контент, нарушающий его условия.

Внутренний документ, недавно попавший в распоряжение New York Times, раскрывает более подробную схему работы рекомендательных алгоритмов TikTok.

Преследуя конечную цель – увеличение прироста ежедневных активных пользователей, – сервис оптимизирует два тесно связанных показателя: «удержание» – то есть возвращение пользователи назад в приложение после того, как он закончил им пользоваться, - и «потраченное на приложение время».

TikTok хочет, чтобы мы оставались там как можно дольше

Новый документ подтверждает подозрения аналитиков, которые считают, что алгоритмические рекомендации представляют собой большую угрозу.

«Эта система означает, что время просмотра является ключевым моментом. Алгоритм пытается вызвать у людей зависимость, а не дать им то, что они действительно хотят, – говорит Гийом Часло, основатель Algo Transparency, команды, пытающейся «опрозрачить» рекомендательные алгоритмы соцсетей. – Я считаю безумной идеей позволить алгоритму TikTok управлять жизнью наших детей. С каждым видео, которое смотрит ребенок, TikTok получает информацию о нем. За несколько часов алгоритм может определить его музыкальные вкусы, его увлечения, узнать, есть ли у него депрессия, склонен ли он к употреблению наркотиков, и много другой конфиденциальной информации. Существует высокий риск того, что часть этой информации будет использована против него: для микротаргетинга или для того, чтобы сделать его более зависимым от платформы».

Время просмотра – не единственный фактор, который учитывается TikTok. Видео оцениваются по специальной формуле, в которой прогноз, основанный на машинном обучении, и фактическое поведение пользователя суммируются для каждого из показателей: лайков, комментариев и времени воспроизведения ролика.

Кроме того, учитывается сам факт просмотра видео и его «прибыльность». Документ указывает на то, что «монетизация для авторов» является одной из целей компании, что позволяет предположить, что TikTok может отдавать предпочтение продвижению более прибыльных видео.

Но и это еще не все: компания оценивает не только каждое видео, но и каждого пользователя.

Ценность юзера зависит от того, насколько он выгоден платформе. Например, некоторые авторы помещают в свои ролики отсылки, и пользователи могут лучше их понять, только посмотрев больше видео этих авторов. В этом случае общая ценность, создаваемая пользователем, выше, чем ценность просмотров каждого отдельного видео. С другой стороны, если пользователю нравится определенный тип видео, и приложение продолжает предлагать ему такие же в течение некоторого времени, ему быстро надоест, и он закроет приложение. В этом случае общая ценность, создаваемая пользователем, просматривающим одни и те же видео, ниже, чем ценность просмотров каждого отдельного видео.

Но самое обескураживающее кроется в одном скриншоте из документа. Он демонстрирует, что модераторы контента имеют доступ не только к опубликованным видео, но и к контенту, отправляемому друзьям или загружаемому в систему, но не переданному в общий доступ. В отличие от таких приложений, как WhatsApp и Signal, которые обеспечивают сквозное шифрование, TikTok знает не только о том, что пользователь делает прилюдно, но и о том, что должно было остаться лично ему.

Точная работа этих алгоритмов куда тоньше и задействуют гигантские массивы данных для подбора контента, который принесет наибольшую выгоду для сервиса.

В любом случае то, насколько хорошо платформа осведомлена о своих пользователях, вызывает закономерный вопрос: а хотят ли сами юзеры, чтобы сервис обладал таким массивом данных о них, или предпочли бы отказаться от этого.
 
 

Загрузка