Кто такой Data Scientist и как им стать. Часть 2: советы от Wargaming

28 сентября 2017, 11:00

Серия успешных сделок белорусских стартапов в области компьютерного зрения и машинного обучения подтолкнула нас к запуску цикла материалов о том, как стать специалистом в этих областях. В первом материале этой серии советы нынешним и будущим специалистам давал «Яндекс». Сегодня специалист минского центра разработки Wargaming расскажет, чем у них занимаются Data Scientist’ы и что учить, чтобы попасть к ним в команду. Слово — Андрею Ярмоле, Manager of Data Science в СООО «Гейм Стрим».  

Читать далее

Андрей Ярмола. Фото из архива DataTalks

Задачи Data Scientist’ов в Wargaming

«Священный Грааль» не только Data Science, но и любой аналитики в игровой индустрии — измерить fun (удовольствие) каждого игрока. Его невозможно измерить напрямую. Поэтому Data Science подходит к этой задаче, аппроксимируя fun. Для анализа используются объективные данные, например, частота и длительность игры, успешность игрока, поведение в игре и т. д.

В сферу ответственности Data Scientist входят несколько классов задач. Остановлюсь на основных:

1. Разработка математических моделей, которые описывают путь развития игрока внутри игры (Player Journey). Такие модели помогают гейм-дизайнерам выявить препятствия, приводящие к оттоку игроков, улучшить баланс игры, оценить состояние игровой экономики, прогнозировать эффект изменений в игре и т. д.

2. Разработка предиктивных моделей. Они помогают оценить вероятность ухода из игры или покупки предмета для каждого игрока. Такие модели востребованы при проведении акций и кампаний, нацеленных на увеличение вовлеченности пользователей.

3. Выявление девиантного поведения. Эта задача очень важна для компаний-разработчиков многопользовательских игр. К девиантному поведению относится использование читов, ботов и ненормативной лексики. Data Scientist разрабатывают алгоритмы, позволяющие находить игроков, которые нарушают правила.

Потребность в аналитике в Wargaming растет постоянно, соответственно, регулярно появляются новые вакансии, связанные с анализом данных. Например, в настоящее время мы ищем Data Scientist в мою команду.

С чего начать: основы геймдизайна и Wargaming Forge

Data Science лежит на стыке нескольких областей: математика, статистика, разработка ПО и доменная экспертиза. К сожалению, сейчас нет программ, которые готовят Data Scientist именно для игровой индустрии. Тем, кто хочет стать Data Scientist в этой области, я бы рекомендовал параллельно с изучением Machine Learning познакомиться с основами гейм-дизайна и регулярно читать портал для разработчиков игр Gamasutra.

Лучший курс для начинающих (при наличии базы) — Machine Learning от Andrew Ng. Если интересуют офлайн-курсы, то стоит попробовать свои силы в Wargaming Forge — образовательной программе от Wargaming и InDataLabs. 

Дисциплины, фреймворки и алгоритмы

Существует немало готовых фреймворков для работы с алгоритмами Machine Learning. В результате некоторым кажется, что на математику налегать не нужно. К сожалению, использование алгоритмов без понимания приводит к ситуации «забиваем гвоздь микроскопом». Кроме того, отсутствие достаточной математической подготовки — одно из главных препятствий, мешающих стать экспертом в Data Science.

Будущим Data Scientist я рекомендую освоить дисциплины:

  • Теория вероятностей;
  • Математическая статистика;
  • Математические методы анализа данных;
  • Дискретная математика;
  • Теория графов;
  • Теория алгоритмов;
  • Математические методы оптимизации;
  • Исследование операций;
  • Методы имитационного моделирования;
  • Теория информации;
  • Численные методы.

В игровой индустрии применяются те же инструменты Machine Learning, что и в других. В Wargaming, например, используются R, Python, Spark, SAS Enterprise Miner, H20. Такое разнообразие инструментов необходимо для эффективного процесса создания моделей от прототипа до деплоймента.

Мне кажется, участие в соревнованиях на Kaggle или любых других подобных — лучший способ получить данные из различных областей. Также можно почерпнуть много полезных «фишек», разбирая решения победителей. В сообществе DataTalks в Facebook мы переодически выкладываем материалы и анонсы мероприятий. 

Будущие специальности: кто в игре, тот и победит   

Мне кажется, что мало какая индустрия предоставляет Data Scientist’у такое разнообразие задач и данных, как игровая. Мы обрабатываем множество данных, применяем для анализа все существующие методы и алгоритмы. Кроме того, игровая индустрия позволяет участвовать в кросс-дисциплинарных исследованиях. Например, недавно мы разработали методологию на стыке Data Science и социологии, которая позволяет выявлять элементы игры, наиболее влияющие на уровень удовлетворённости игроков.

ИИ, нейронные сети, если они используются правильно, несомненно, являются и будут являться конкурентным преимуществом в будущем. Но игровая индустрия потому и называется игровой, что главное в ней — это игра.

Фото: из архива Сергея Кадомского

 

Читайте также: Кто такой Data Scientist и как им стать. Часть 1: советы от «Яндекса»

Обсуждение