Отдел новостей 1 января 2019, 14:15

Оценки, «звёзды», «пальцы вверх — пальцы вниз». Психология рейтинговых систем с точки зрения разработчика

Для многих пользователей рейтинги и оценки являются ключевым фактором при выборе продуктов и услуг. Однако люди не всегда отдают себе отчёт в том, какие механизмы и психологические законы лежат в основе различных моделей рейтинговых систем. Этот вопрос рассмотрел разработчик Химаншу Кханна в статье на Hacker Noon.

У Uber, как и у других потребительских сервисов, действует очень любопытная рейтинговая система — для пассажиров и для водителей. Клиент сервиса Арджун лидирует в рейтинге пассажиров с результатом 4,91 — но не потому, что использует особые уловки, а просто потому, что вежлив и умеет легко завязать разговор. Как-то раз от одного из водителей он получил «кол». Когда Арджун поинтересовался, за что удостоился минимального балла, водитель с улыбкой ответил, что дал ему лучшую оценку: № 1.

Стоит ли отказаться от «звёзд»

В 2017 году Netflix сделала большой прорыв, отказавшись от звёздочной системы оценок в пользу системы «пальцы вверх — пальцы вниз». Аналогичную модель лайков и дизлайков ещё в 2009 году внедрил YouTube. Как объяснялось в сопутствующем блогпосте, причиной стал паттерн «всё или ничего».

Подавляющее большинство роликов на YouTube имели 5-звёздочный рейтинг. Это значило, что пользователи были склонны бросаться в крайности и выставляли оценки только тогда, когда видеозапись вызывала либо полный восторг, либо сильное отвращение. В остальных случаях они никак не реагировали на ролики. Важно отметить, что средняя оценка видео на YouTube была общей для всех пользователей. Пять красных звёзд на Netflix означают, что фильм или сериал идеально подходит под вкусы конкретного пользователя. Рейтинг, который человек видел рядом с каждым фильмом или сериалом на Netflix, был средним среди зрителей со схожими предпочтениями, а не для всех пользователей, в отличие от YouTube.

Как часто пользователи ставят оценки

Когда-то Uber хотел принуждать пассажиров ставить оценку водителю, прежде чем позволить им совершить следующую поездку. Сейчас это можно делать по желанию, однако пользователи воздерживаются от оценок лишь в редких случаях. В 2014 году Uber выпустил гайд для водителей, разъясняющий механизм рейтинговой системы. Кроме того, если рейтинг водителя был ниже 4,6 баллов, сервис мог деактивировать его аккаунт.

«Отключение аккаунтов водителей, которые систематически предоставляют неудовлетворительные услуги, поможет Uber сохранить имидж качественной компании».

Водители борются за высокий рейтинг, потому что от этого зависит их заработок. Так же, как и рестораны, у которых от рейтинга зависит посещаемость, и многие другие продукты и сервисы, прибыль которых тоже пропорциональна рейтингу.

Но, возможно, не все люди одинаково понимают рейтинги. Прежде всего нужно понимать идею такой системы оценок в принципе, особенно в контексте современных цифровых продуктов.

Рейтинговая система в цифровом мире

Рейтинговую систему можно рассматривать как вложение пользователей в продукт. Как только они чётко поймут свою выгоду от этого вложения и захотят её получить, то будут вкладываться в продукт с большей вероятностью и активнее участвовать в рейтинговой системе. Они станут двигателем роста продукта, поощряя хорошие практики и пресекая плохие.

В ходе одного опроса на эту тему более половины респондентов заявили, что не станут смотреть фильм, если его рейтинг на IMDB ниже 7, а для программ и сериалов они «установили» минимальный порог для просмотра в 8 баллов. Один из опрошенных отметил, что практически никогда не ставит фильму больше 8, при условии, что это идеальный фильм. В то время как 7-ка считается приемлемой, на 9 фильмы оценивают лишь в исключительных случаях. На Netflix одни и те же пользователи проголосовали бы за один и тот же фильм одинаково: «пальцем вверх».

Платформы, их использование, рейтинговые системы и итоговый показатель вовлечённости, вероятно, играют огромную психологическую роль в том, как пользователь оценивает единицу контента. Цвета, лейблы и непосредственное воздействие рейтинга также являются важными факторами.

Около 80 процентов опрошенных утверждают, что пользуются Uber по крайней мере раз в неделю, причём более 30 процентов — ежедневно. Около 50 процентов из этих пассажиров отменят поездку, если рейтинг водителя ниже 4,5 из 5.

Респонденты этой же выборки просматривают списки Zomato (глобальная онлайн-платформа, которая предоставляет информацию о ресторанах по всему миру) минимум раз в месяц. Но здесь требования к заведениям пониже: 3,8 из 5. В данном случае на восприятие рейтинга влияют частота использования и значимость в повседневной жизни.

«Оценка 4 означает, что продукт или услуга соответствует ожиданиям, 5 — что превосходит ожидания».

«Лайки» в Instagram или Facebook и ретвиты на Twitter тоже представляют собой рейтинговые системы, только бинарные. Обычно пользователи не ставят оценки чему-то посредственному. Они реагируют на то, что вызвало в них сильный эмоциональный отклик: восторг или ненависть. Соцсети (Facebook, Twitter и Instagram) не интересует второй вид контента. Они ценят и раскручивают то, что нравится их аудитории. Бинарные системы упрощают выставление оценок, потому что в этом случае пользователям нужно совершать целевое действие только тогда, когда им что-то нравится на платформе.

Групповые нормы и конформизм

В 1936 году Музафер Шериф провел классический эксперимент. Участников помещали в тёмную комнату, где они должны были наблюдать за световой точкой на расстоянии около 5 метров и пытаться определить, на сколько, по их мнению, она сместилась. В случае, когда участники проходили тест по отдельности, их оценки варьировались значительно больше, чем в группах по три человека — тогда испытуемые называли более схожие цифры. Этот эксперимент продемонстрировал, что вместо того, чтобы принимать независимые решения, люди стремятся подстраиваться под мнение группы.

Пользователь Instagram видит, что тот или иной пост набрал 5,059,031 лайк и, поддавшись мнению других пользователей, ставит очередной лайк. Такой конформизм срабатывает с рейтингами, звёздами, голосами и прочими системами оценки, если сумма (или среднее значение) рейтингов показывается прежде, чем человек примет самостоятельное решение. Это явление может быть одним из ключевых факторов виральности в социальных сетях.

Аплодисменты как инструмент подсчёта рейтинга

В середине 2017 года Medium заменил бинарный эквивалент лайка — кнопку «рекомендовать» в виде сердечка — на «аплодисменты». Этот радикальный шаг превратил читателя из ценителя статьи в оценщика. Одной статье пользователь может «похлопать» до 50 раз, причём количество хлопков в диапазоне от 0 до 50 раз будет отражать степень, в которой она ему понравилась (или же её качество), что немногим отличается от «звёздочной» рейтинговой системы.

На Facebook пользователь может поставить лайк своему же посту. На Medium похлопать себе нельзя.

Есть одно необычное отличие между «звёздными» рейтингами и системой аплодисментов на Medium — визуальная недоступность подсчётов. Если в формате звёзд пользователю предлагается пять вариантов оценки, то на Medium выбор, образно говоря, бесконечный. Многие опасаются, что это нововведение приведёт к «инфляции» «оценочной валюты» на платформе, той есть уменьшению значимости одного хлопка в общем рейтинге статьи: 20 тысяч хлопков теперь кажутся не настолько выдающимся результатом в сравнении с прежними 2 тысячами рекомендаций. Хотя если продолжит срабатывать такое явление, как конформизм, статья имеет лучшие шансы получить ещё больше хлопков, если уже набрала их 20 тысяч, чем 2 тысячи.

Разбираемся дальше

В некоторых случаях принцип подсчёта среднего значения по всем оценкам оборачивается против самой рейтинговой системы. Допустим, при наборе критического числа оценок в 5-балльной системе средний рейтинг продукта или услуги оказался равным 4,3. В большинстве случаев в дальнейшем — при условии, что пользователи продолжают активно выставлять оценки — потребуется немалое количество экстремальных значений (1 или 5), чтобы сместить рейтинг на 4,2 или 4,4. После n-ного числа оценок результат 4,3 из 5 станет устойчивым средним рейтингом. Тогда никакие отклики — даже самые восторженные или разгромные — существенно не отразятся на этом показателе, и потенциально важная обратная связь останется незамеченной.

Все водители Uber обязаны выставлять оценки каждому пассажиру в конце поездки — в отличие от пассажиров, которые могут делать это по желанию. Аналогично, пользователи Zomato и Amazon могут оставлять или не оставлять отзывы о покупках по своему усмотрению. Кроме того, Amazon позволяет делать рецензии на продукты, которые не были куплены непосредственно через платформу, в результате чего их рейтинг может падать до всего 2 баллов.

«Отзывы на Amazon иногда пишут не совсем адекватные люди. Я не раз покупал товары с рейтингом 2-3, и был очень ими доволен».

Характер, настроение и окружение пользователя, срочность приобретения, удовлетворение и польза от покупки, инфлюенсеры и их близость к пользователю — все эти факторы в значительной степени влияют на оценку пользователя. В ходе опроса был сделан ещё один примечательный вывод: пользователям очень легко выставлять оценки приложениям со смартфонов благодаря их удобству. 74 процента респондентов больше предпочитают ставить оценки именно мобильных телефонов, чем с прочих устройств. Однако некоторые пользователи отказываются ставить рейтинги приложениям или услугам, если от них требуют написать развёрнутый отзыв.

Будущее рейтинговых систем

В одной из серий «Чёрного зеркала» авторы изобразили наступление цифровой эры и психологию рейтинговых систем. Это сатирическая серия, в которой люди могли ставить друг другу оценки по 5-балльной шкале в реальном и виртуальном мирах. Всё: статус в обществе, доступ к определённым услугам, шансы человека на трудоустройство — обусловливалось его рейтингом.

Человечество вырастило поколение зацикленных критиков, которые следят за каждым движением официанта в ресторане, оценивают звон приборов, когда их кладут на стол, присматриваются, насколько почтительно официант принимает заказ, живо делая заметки и мысленно выстраивая алгоритмы для подсчёта соответствующей оценки, после чего переключаются на следующий предмет критики.

Уровень потребления цифровых продуктов постоянно растёт, психологией управляют понятия «пользовательский опыт» и «геймификация», а значит, рейтинговые системы будут процветать.

По теме