Google обновила речевые сервисы для разработчиков

Оставить комментарий
Google обновила речевые сервисы для разработчиков

API для синтеза речи из текста и преобразования речи в текст сервиса Google Cloud сегодня получили ряд обновлений: поддержку большего числа языков, больший выбор голосов озвучки и улучшенные инструменты распознавания речи, пишет TechCrunch.

Прежде всего появилось 17 новых голосов в WaveNet — это звуковой движок Google на основе нейросети для генерации аудио из текста. Также голоса стали звучать более естественно.

Text-to-Speech API, доступ к которому теперь предоставляется всем пользователям, поддерживает 14 языков и предлагает 30 стандартных голосов и 26 голосов WaveNet. Послушать их бесплатно на любом отрывке текста можно здесь.

Ещё одно обновление — бета-версия аудиопрофилей. Их суть — оптимизировать аудиофайл под используемое для воспроизведения устройство, например, динамик телефона, наушники или колонки.

Что касается Speech-to-Text API, разработчикам станет проще транскрибировать записи с несколькими спикерами. Сервис на основе машинного обучения теперь может распознавать различных людей (хотя пользователю всё равно придётся сначала указать их количество на записи). Каждому слову он будет приписывать номер говорящего. Для стереофайлов с двумя участниками (например, сотрудник и клиент службы поддержки) Google будет разделять каналы и различать говорящих.

Разработчики смогут выбирать до 4 языков, а Speech-to-Text API автоматически определит, на каком них говорят люди.  Также в Speech-to-Text API вернули показатели степени уверенности при распознавании слов. Как отмечает Google, эту функцию можно использовать при создании приложений с упором на отдельные значимые слова.

Хотите сообщить важную новость?

Пишите в наш Телеграм

Горячие события

GoWayFest 4.0 Online Edition Conference
11 июля — 12 июля

GoWayFest 4.0 Online Edition Conference

Минск

Читайте также

Разработчик AIMATTER два года поработал в Google и вернулся в Беларусь
Разработчик AIMATTER два года поработал в Google и вернулся в Беларусь

Разработчик AIMATTER два года поработал в Google и вернулся в Беларусь

Минчанин Юрий Писарчик за свою карьеру успел поработать сразу в двух топовых компаниях — Яндекс и Google. В интервью tut.by он рассказал, как попал в ИТ, что понравилось и не понравилось в Кремниевой долине, и почему после двух лет работы в Google он вернулся в Беларусь.
18 комментариев
ABBYY впервые опубликовала на GitHub библиотеку разработок машинного обучения
ABBYY впервые опубликовала на GitHub библиотеку разработок машинного обучения

ABBYY впервые опубликовала на GitHub библиотеку разработок машинного обучения

Google выпустила бета-версию Android 11. Установить можно всем желающим
Google выпустила бета-версию Android 11. Установить можно всем желающим

Google выпустила бета-версию Android 11. Установить можно всем желающим

Исследование: искусственному интеллекту тоже нужен отдых
Исследование: искусственному интеллекту тоже нужен отдых

Исследование: искусственному интеллекту тоже нужен отдых

5 комментариев

Обсуждение

Комментариев пока нет.
Спасибо! 

Получать рассылки dev.by про белорусское ИТ

Что-то пошло не так. Попробуйте позже