«Алиса, заткнись». Белорусский стартап-выпускник Y Combinator — о будущем голосовых ассистентов

12 июня 2018, 08:45

На YaC-2018 «Яндекс» представила платформу «Яндекс.Диалоги», которая позволяет создавать приложения для голосового помощника «Алиса». По такому случаю dev.by поговорил с основателем сервиса Storyline Василием Шинкоренко о том, будет ли белорусский стартап теперь поддерживать «Алису» и кто из ИТ-гигантов выиграет битву за рынок голосовых ассистентов. 

читать далее

Справка dev.by. Storyline — первая компания в Беларуси, в которую инвестировал Y Combinator. Продукт даёт возможность создавать приложения для Amazon Alexa без знаний программирования. В марте этого года стартап стал официальным партнёром Amazon. С помощью Storyline уже создано 1800 из 40 000 приложений для Alexa.

«Алиса» — не по зубам Siri в русскоязычном сегменте

Каково твоё мнение об анонсированной «Яндексом» платформе для создания голосовых приложений? Не запоздали с выходом на рынок?

Думаю, что не запоздали. На российском рынке у «Яндекса» нет конкурентов, поэтому можно сказать, что «Яндекс.Диалоги» — это первый стор (каталог навыков для голосового ассистента) с русскоязычными скилами.

Единственный голосовой ассистент, который поддерживает русский язык — это Siri, но тягаться с «Алисой» ей бессмысленно.

На мой взгляд, запуск «Яндекс.Диалоги» ставит «Алису» на первую позицию в русскоязычном сегменте. Однако не думаю, что это сильно поменяет стратегию выхода Amazon на российский рынок, если она у неё есть.

Как думаешь, пользуется «Алиса» спросом у русскоязычного населения?

Буквально на днях был у меня интересный случай. Вышел я из офиса, сел в такси, а там водитель разговаривает с «Алисой». И я просто офигел, почувствовал себя в будущем. Водитель ещё неудачно припарковался, пришлось на тротуар заехать. Из-за этого он стал ругаться на парня, который его подрезал, а «Алиса» подумала, что это к ней обращаются. И ответила: «Вы какими словами со мной разговариваете!». А он ей: «Да заткнись ты, сейчас вообще не до тебя».

Интересно, конечно, то, что это был не какой-нибудь 20-30-летний айтишник, а таксист и причём в возрасте. И выглядело это так натурально, просто crazy.

Одинаковый API во всех голосовых ассистентах   

Storyline не думает саппортить «Алису»? Сейчас, наверное, самое время...

Я бы не сказал, что сейчас самое время. «Яндекс.Станций» на рынке ноль, есть только предзаказы. Нужно время, чтобы появилась экосистема вокруг голосового помощника. К Alexa люди привыкают уже четвёртый год. К тому же, из-за того, что вся наша аудитория англоязычная, добавление русского языка, локализация и другие задачи займут немало времени.

В планах мы, конечно, хотим объединить все существующие платформы для создания голосовых приложений в один стек на Storyline. И тогда одно приложение, сделанное на Storyline, можно будет запускать на всех платформах сразу.

Есть ли в API «Алисы» что-нибудь оригинальное, прорывное?

API «Алисы» очень похож на API других голосовых ассистентов: та же модель, те же взаимодействия, интенты и пр. На самом деле сложно придумать что-то новое в распознавании голоса. Поэтому компании стараются не изобретать велосипед и делают похожие API. Они же от этого и выигрывают: намного проще заманить разработчиков, которые уже делают приложения под другие платформы.

Storyline

Из хорошего можно отметить, что «Алиса» удивительно хорошо и быстро понимает русскую речь.

А ещё распознаёт англицизмы…

Не знал об этом, но это круто. Думаю, у «Яндекса» всё будет отлично, у них классная ML-команда, которая делает «Алису».

Есть только один недостаток — компания работает на российский рынок…

Да, Юра Гурский как-то сказал: запускаться на российском рынке — это всё равно, что плавать в луже воды, пролитой из под стакана. Сколько стоит сейчас «Яндекс»? $11.3 млрд. А Alphabet уже $781 млрд.

Самое сложное — запомнить название приложения

Что есть в других голосовых ассистентах, но нет в российской разработке?

Простой пример — фича «аудиоплеер», которая позволяет Alexa запускать аудиофайлы любой длины и радиостанции. В контексте голосовых приложений — это первый кейс, когда ты можешь поговорить с радио.

Также классная фича в Alexa — запуск приложений по их архитектуре (контексту). Например, я не знаю, как называется конкретное приложение, и могу попросить включить просто yoga sound или relaxing music. Это большой прорыв, потому что сейчас у пользователя есть две проблемы: найти приложение голосом, не зная его точного названия, и на следующий день вспомнить, как же оно называется, чтобы открыть ещё раз.

У «Алисы» пока нет монетизации, а у Alexa есть — это то, над чем мы сейчас работаем. Кстати, мы заметили, что как только в Alexa появилась возможность зарабатывать, изменилось поведение юзеров. Если раньше на вопрос «зачем вы делаете приложение?» большинство отвечало: for fun, то сейчас — make money.  

Какие приложения продаются лучше всего?

Лучше всего продаются приложения с аудиоконтентом. Больше всего ценятся успокаивающие, релаксирующие звуки. В бесплатной версии можно включить либо звук дождя, либо грома, а в премиум — можно сказать: «Alexa, включи мне звук дождя с громом и камином». И люди платят, потому что это круто и решает проблему.

Чей голосовой ассистент умнее

Каково, на твой взгляд, текущее положение сторов (каталогов навыков) голосовых помощников?

Google в первом квартале этого года продала больше девайсов, чем Amazon. Тому есть две причины — компания продаёт устройства в регионах, где нет Alexa, и почти бесплатно (боятся проиграть рынок поиска). Но результаты от этого всё равно не утешительные.

В Alexa уже 40 тысяч приложений (больше 4 процента из них — 1800 сделаны на Storyline). У Google что-то около нескольких тысяч, и они все полумёртвые. А в американском магазине скиллов для Alexa уже есть приложения с сотнями тысяч пользователей.

У «Алисы», на мой взгляд, стор пока что хиленький, даже не знаю, где там 4000 анонсированных приложений. По моему мнению, это ещё сырой MVP. Мне кажется, что «Яндексу» будет сложно выйти на рынок через девайсы, потому что их колонка достаточно дорогая ($160, — прим.ред.). В то же время у них нет конкурентов в СНГ, поэтом шансы занять нишу голосовых ассистентов есть.

Также интересно то, что «Алису» можно использовать в разных приложениях «Яндекса»: карты, навигатор и т.д. — это увеличивает аудиторию российского голосового помощника.

Гонка за лидерство. Apple вне игры?

Кто, на твой взгляд, может выиграть в битве за лидерство на рынке голосовых ассистентов?

В 2004 году на рынке браузеров 96 процентов занимал Explorer, и все думали: как может появиться ещё один браузер? Оказалось, может. В случае с голосовыми ассистентами я склоняюсь к мнению, что winner takes all.

Рынок голосовых ассистентов сейчас похож на рынок поисковых систем, но здесь пока ещё никто не сделал Google. Похоже, что это будет Amazon с её Alexa, но есть вероятность, что это будет сама Google.

Но есть же, наверное, какие-то метрики, по которым можно будет выделить победителя. Скажем, у кого больше спикеров...

В этой нише всё гораздо интереснее, чем с поисковиками, потому что использование голосовых помощников не ограничивается только колонкой. Основное здесь — это экосистема. В этом плане у Google есть преимущество перед Amazon. Alexa живёт только в колонке, а Google Assistant — в нескольких миллиардах смартфонах, которые поддерживают Android.

Если смотреть с этой точки зрения, то рынок у Alexa крохотный (50 млн спикеров — это ничто по сравнению с миллиардами андроидов). Но это не совсем так, потому что контексты использования устройств разные. Люди до сих пор не так часто используют Google Assistant и Siri, как Alexa.

Жаль, конечно, что Apple упустила эту нишу. И это при том, что она первая показала Siri, что уже не типично для компании. Но всё же я бы не списывал Apple со счетов, учитывая количество айфонов в мире. Всё ещё может поменяться.

Команда Storyline

От кровати до кровати с голосовым помощником

Как изменятся голосовые помощники в ближайшее время?

Amazon, например, движется в сторону multimodal (голос плюс визуальная часть), интегрируется с телевизорами, и, можно сказать, Alexa становится пультом. Это очень круто. В Alexa уже есть такие приложения, как «видео скилл», с помощью которых можно выводить информацию на TV.

Их цель — сделать из Alexa операционную систему. Суть в том, что голосовой помощник будет сопровождать тебя, начиная с того момента, как ты проснулся, и заканчивая тем, когда ты лёг спать. С утра ты говоришь «Alexa, good morning», и она включает музыку, зажигает свет, вызывает Uber и пр.

Потом идёшь на кухню, и можешь через Alexa поискать рецепт завтрака, послушать новости, или любимый подкаст. Когда садишься в машину ехать на работу, голосовой помощник говорит адрес, включает музыку и пр. На твоём рабочем столе стоит голосовой ассистент, который выполняет уже рабочие задачи.

Вы не представляете, насколько удобно бронировать переговорки через голосового помощника. В офисе Amazon, когда мы проходили мимо какой-то переговорной, можно было сказать «Alexa, book this room in 10 minutes». И всё! И она понимала, кому и когда забронировать переговорную комнату.

 

Фото: dev.by

Обсуждение