Как алгоритм Pinterest борется со спамом, теориями заговора и антипрививочниками

9 ноября 2019, 14:51
Как алгоритм Pinterest борется со спамом, теориями заговора и антипрививочниками

Уилл Оремус, колумнист OneZero (Medium) рассказал, как Pinterest смог выстроить мощную рекомендательную систему и избежать скандалов, в которые попадают конкурирующие соцсети. Публикуем перевод материала.

Пользователь с самого начала сам помогает компании составить свой профиль. При регистрации сервис запрашивает его возраст и пол. В зависимости от ответов, а также языка, страны и кое-какой истории браузера пользователя, Pinterest делает подборку потенциально актуальных для него тем и предлагает подписаться на минимум 5.

Далее ML-алгоритм Pinterest генерирует ленту картинок (пинов), которые, как он предполагает, могут заинтересовать пользователя. Это важный момент: аналитика Pinterest показывает, что если человек сразу же видит интересные пины, то он с высокой вероятностью станет активным пользователем и будет постоянно возвращаться за свежим контентом, просматривать связанную с ним рекламу и управлять собственной доской связанных пинов. Если же при «первом знакомстве» человек не нашёл для себя ничего стоящего, он может больше не вернуться.

Аудитория Pinterest ежегодно прибавляет 50 млн и сейчас насчитывает 300 млн пользователей. Код алгоритма в основе ленты, поисковика и уведомлений сайта аналогичен тому, что в новостной ленте Facebook, рекомендациях YouTube или TikTok. Это центральный продукт компании с $15-миллиардной оценкой, которая в этом году успешно провела IPO — причём она стала единственной среди технологических единорогов, таких как Uber, Lyft и Slack, чьи акции стабильно торгуются выше изначально установленной цены.

Разработчики и менеджеры Pinterest сталкиваются с такими же сложностями, как и другие соцсети. Но лидеры компании ищут менее «искромётный» и более «человечный» путь к успеху в Кремниевой долине. Сейчас Pinterest стоит перед большим вызовом: расширить пользовательскую базу, в которой всегда преобладали белые женщины из пригородов, не оттолкнув нынешних поклонников и не пытаясь подогнать под шаблон — новых, а также не допустить распространения фейков и радикализации.

Недавно сервис запустил функцию, которая устранила одно из самых раздражающих неудобств: алгоритм иногда делал неправильные выводы на основе последних действий пользователей и захламлял ленты нерелевантным контентом (например, показывал свадебные платья пользовательницам, которые передумали выходить замуж). Функция «Настроить ленту» (Tune your home feed) позволяет вручную изменять историю и интересы — по сути, сказать алгоритму, что помнить или забыть.

Новшество призвано снизить число жалоб на материалы и улучшить наполнение ленты для продвинутых пользователей. Это мало чем поможет сайту расти — он даже рискует «уронить» вовлечённость пользователей, которые станут ограничивать количество доступной для алгоритма информации. Но компания готова пойти на эту уступку, тем более что во время ранних тестов критического спада активности пользователей не произошло.

Функция «Настроить ленту» в Pinterest.

Функция «Настроить ленту» в Pinterest.

Иногда найти «компромиссы» сложнее: например, как понять пользователей достаточно глубоко, чтобы заставить их возвращаться, и при этом не дать им заскучать, не навешать ярлыки и не отпугнуть их?

— Пользователям не нравится, когда их стригут под одну гребёнку. Они не хотят, чтобы мы пытались угадать их вкусы по демографическим признакам, — говорит глава подразделения по инклюзивности и разнообразию Pinterest Кэндис Морган, занимающаяся поиском способов улучшить выдачу пинов для пользователей, которые недостаточно представлены на платформе.

И всё же свои первые догадки (по крайней мере на начальных этапах после регистрации) Pinterest делает именно исходя из демографических признаков. Иначе некоторые пользователи просто не понимали бы смысл сервиса.

Pinterest не обошли стороной и другие беды крупных конкурентов: массовая дезинформация, радикализация, контент оскорбительного содержания, спам и сомнительные сайты, эксплуатирующие сервис для наживы.

Отличается то, как Pinterest подходит к ним: компания решила признать наличие предвзятости, ограничить виральность и стать своего рода «антисоцсетью». И пока эта стратегия работает.

Поначалу (Pinterest основан в 2010 году) популярность сервиса росла очень медленно. Всё изменилось после того, как сооснователь Pinterest Бен Зильберман представил его на конференции для женщин-блогеров и инфлюенсеров, которые сразу полюбили сайт. Он стал процветать среди женщин и жителей пригородов, для которых служил идеальной площадкой по обмену рецептами, модными советами и идеями для хендмейда или интерьера.

Состав ранних пользователей определил дальнейшую траекторию развития Pinterest. Разработчики создавали сервис по лекалу соцсети и строили алгоритмы персонализации контента, которые учились на поведении пользователей — их интересах и паттернах активности. Но излишняя зависимость от данных, сгенерированных ранними пользователями, имела свои минусы: например, на некоторых досках со свадебными платьями присутствовали только светлокожие модели.

Изначально в ленте выводились самые популярные пины от всех пользователей на основе того, на какие доски подписан человек. Это годилось для привлечения новых пользователей с такими же вкусами, но ограничивало разнообразие на сайте. Мужчины считали Pinterest сайтом для «женских штучек», хотя контент не был заточен под определённый пол, отмечает Морган.

Со временем Pinterest был вынужден перепроектировать свои системы и переобучить алгоритмы для лучшего таргетирования различных групп пользователей и составления «карт» их интересов. Именно поэтому при регистрации сервис просит указать пол, выбрать темы (чтобы алгоритм получил представление об интересах человека) и «заглядывает» в историю браузера, чтобы узнать, посещал ли человек Pinterest раньше и откуда перешёл на него.

К примеру, вопрос о языке и религии помог сервису достичь иностранную аудиторию, которой платформа казалась «совсем чужой уже на моменте подписки». Сейчас более половины пользователей Pinterest — не из США. Это помогает сервису быть более открытым: так, в Японии вероятность того, что новый посетитель станет активным пользователем Pinterest, одинакова среди мужчин и женщин.

Пол и возраст с самого начала определяют, какой контент будет видеть новый пользователь Pinterest. Выше — подборка для человека, указавшего мужской пол и возраст 30 лет.

Пол и возраст с самого начала определяют, какой контент будет видеть новый пользователь Pinterest. Выше — подборка для человека, указавшего мужской пол и возраст 30 лет.

Но к делению пользователей на более мелкие группы нужно подходить осторожно, особенно в случае с группами, представителей которых на сайте очень мало. Даже если внутренние данные говорят о том, что активацию пользователей мужского пола повышают изображения брутальных мужчин, то некоторых может, наоборот, отталкивать или обижать предположение, что их привлекают картинки квартир холостяков или знаменитостей-женщин.

Pinterest пытается помочь пользователям найти в продукте себя. В январе команда по диверсификации выпустила один из своих первых инструментов: он позволяет фильтровать пины в теме «Красота» по заданному пользователем цвету и оттенку кожи. Хотя Морган признаёт, что не все пользователи хотят раскрывать больше данных о себе в обмен на лучшую персонализацию.

Pinterest никогда не привлекал столько внимания в СМИ, как Twitter или Facebook, но ему не чужды проблемы, из-за которых разразились скандалы вокруг других социальных платформ.

В 2017 году эксперт по онлайн-коммуникации Майк Колфилд занялся изучением политической культуры Pinterest и обнаружил доски с фейковыми новостями, этническими стереотипами и теориями заговора. Он тогда заявил, что агрессивный рекомендательный алгоритм в паре с тем фактом, что доски наполняют сами пользователи сайта, может в миг превратить ленту в помойку, забитую пропагандой ненависти.

Одна из причин проблемы в том, что алгоритм эксплуатируют спамеры, которые размещают виральные политические мемы на одних досках, например, с футболками для продажи. Если пользователи нажимают на мемы, алгоритм показывает им другие пины с той же доски, заключив, что они тоже могут быть интересны. Далее показывает им майки, кто-то из пользователей покупает их, спамеры получают выручку.

Как правило, говорит Колфилд, ИТ-компании либо игнорируют его критику, либо защищаются. К его удивлению, Pinterest отреагировал иначе: компания поблагодарила его и пригласила встретиться с менеджментом, чтобы вместе попробовать решить проблему.

По крайней мере одно такое решение — против антипрививочного движения — удалось успешно реализовать. В августе Pinterest изменил механизм обработки запросов о вакцинах своим поисковиком: теперь в выдаче находятся не самые популярные пины, а только пины от крупных здравоохранительных организаций вроде ВОЗ или Центра контроля заболеваний (США). По словам Колфилда, ни одна другая платформа не предпринимала таких кардинальных шагов, демонстрирующих готовность корректировать свой софт для решения системных проблем, с которыми алгоритм не может справиться в одиночку.

Обычно соцсети предпочитают не передавать в руки пользователей слишком много прав персонализации лент. Facebook завоевала мировое господство при помощи алгоритма подбора ленты, который лучше них «знает», на что они кликнут с большей вероятностью. Instagram и Twitter годами отвергали алгоритмические ленты, но в итоге пришли к автоматизации — и их аудитория и выручка выросла. Каждое действие пользователей помогает алгоритму оптимизироваться, и дав им слишком много контроля, можно нарушить его работу.

Pinterest, как и конкуренты, оценивает себя по таким метрикам, как число ежемесячных активных пользователей и коэффициент активации. Но полировка пользовательских лент и наполнение контентом, с которым они взаимодействовали раньше, имеет побочные эффекты: к примеру, люди становятся зависимыми или привыкают бездумно листать ленту, либо попадают в плен фейков.

В последнее время соцсети всё больше смотрят в сторону «качественных» целей: Facebook ввела концепцию «качественно проведённого времени» (time well spent), а Twitter — «здорового диалога» (healthy conversations). Это вдохновило недавнюю функцию Pinterest.

Одной из самых частых жалоб пользователей была нехватка возможностей управления контентом, который им показывает алгоритм (стоило пользователю нажать на пин, как вся лента была завалена похожими картинками). Вопрос был в том, как исправить ситуацию без ущерба эффективности алгоритма и показателям вовлечения. Но команда подошла к ней с другой стороны: было решено полностью забыть об эффективности и вовлечении и сосредоточиться исключительно на снижении числа жалоб от пользователей из-за чехарды в ленте после каждого их действия.

Результатом стала новая функция кастомизации ленты. Pinterest считает, что прибегать к ней будут немногие, но тестирования показали, что среди этих немногих было очень много тех, кто подавал жалобы и в то же время был самым преданным фанатом сайта. Причём на вовлечении изменение особо не сказалось.

Pinterest извлёк урок. «Это призыв к остальным платформам: открываться пользователям», — говорит Омал Сейал, глава продуктовой команды сервиса.

Pinterest дал пользователям больше настроек, но как и у других соцсетей, его ядро составляют рекомендательный алгоритм, а значит, он не защищён от предвзятости. Но в отличие от других Pinterest признаёт это:

— В конце концов, контент на нашей платформе генерируют пользователи, и мы не можем отследить всё, что они создают. Среди них есть спамеры и люди, использующие платформу для распространения негативного контента. И это плохо, — отмечает Сейал.

Всё, что может сделать компания, это посмотреть, какого типа контент её система выводит чаще, и скорректировать параметры алгоритма так, чтобы один контент был в приоритете над другим.

К примеру, алгоритм Pinterest считает сохранение пина гораздо более весомым положительным сигналом, чем просмотр: люди не сохраняют провокационные статьи о президентах — они сохраняют одежду, которую хотели бы купить. Поэтому алгоритм смещается в сторону как раз таких действий, а не в сторону взаимодействий с друзьями.

Такой подход — отклонение от взаимодействий между друзьями — может показаться странным для социальной сети. Но Pinterest утверждает, что отчасти именно благодаря этому смог сгладить такие проблемы, как оскорбление и вирусная пропаганда: алгоритм просто не продвигает такие пины, и спаму или дезинформации непросто попасть «в топ».

Pinterest дифференцирует даже клики: переходы на качественные сайты «весят» больше, чем на другие. Тестируя любое изменение в алгоритме, команда смотрит, как оно влияет на исходящий трафик на список вручную подобранных надёжных сайтов по таким темам, как образ жизни, мода и интерьер. Если изменение уводит трафик с этих сайтов на другие, продуктовая команда выясняет, почему так происходит: возможно, оно открыло лазейку, через которую менее авторитетные ресурсы «обманывают» алгоритм.

Все крупнейшие социальные платформы манипулируют алгоритмами подобным образом, признают они это или нет. По мнению некоторых критиков, корень многих проблем соцсетей в том, что они не желают признавать присущую их алгоритмам предвзятость, ведь такая позиция обеспечивает им постоянный приток пользователей.

По словам Сейала, у Pinterest, как и у других ИТ-гигантов, есть оптимистичные планы и грандиозные идеи: сервис разрабатывает новые форматы, и новые способы взаимодействия с контентом. Он надеется, что в будущем алгоритм Pinterest будет не только отражать предпочтения пользователей, но и участвовать в их формировании, подобно топовым модным брендам. Как образец Сейал приводит курируемые редакторами плейлисты Spotify.

Но главное, уверен он, чтобы по мере развития Pinterest всегда помнил о своих ограничениях: «Я думаю, нам нужно стараться быть лучше лишь в том, в чём мы можем быть лучше. Ждать, что каждый пользователь будет проводить с продуктом каждую минуту своего времени, как-то самонадеянно. Технологические компании не могут получить всё на свете — такова жизнь».


Работа в ИТ в Беларуси​.​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​

1. Заполните анонимную форму — 5 минут.
2. Укажите зарплатные (и другие) ожидания.
3. Выберите желаемую индустрию или область деятельности.
4. Получайте релевантные предложения​​.​​​​​​​​​​​​ ​

подписка на главные новости 
недели != спам
# ит-новости
# анонсы событий
# вакансии
Обсуждение