Отдел новостей 8 июня 2018, 12:23

В противовес гигантам: Mozilla расширяет открытые датасеты для распознавания речи

Проект Common Voice от Mozilla запустили для создания открытых наборов данных для распознавания речи, и на днях он пополнился новыми языками, сообщает VentureBeat.

Иллюстрация: Mozilla

Mozilla анонсировала проект в прошлом июне: тогда она предложила желающим со всего мира начитывать отрывки теста с через браузер и мобильные приложения. Первые датасеты Common Voice на английском языке вышли в ноябре: набор из 400 тысяч записей от 20 тысяч человек включал около 500 часов речи. Теперь компания начинает сбор данных для трёх новых языков: французского, немецкого и валлийского. Mozilla ведёт подготовительные работы по сборы данных на ещё 40 языках. Приоритетными для компании являются бразильский, португальский, китайский, индонезийский, польский и голландский.

Проект служит своего рода противопоставлением растущему количеству проприетарных технологий распознавания речи. Компании вроде Amazon, Google, Apple и Microsoft делают значительные вложения в разработку управляемых голосом цифровых помощников Alexa, Google Assistant, Siri и Cortana, но датасеты находятся в собственности компаний. Именно поэтому Mozilla решила создать открытый датасет, который будет бесплатно доступен для всех, кто хотел бы создавать продукты и сервисы на основе технологии распознавания речи.

«Мы считаем, что эти интерфейсы не должны принадлежать нескольким компаниям как единственным, кто может создавать сервисы на основе голосовых данных. Мы хотим, чтобы пользователей понимали на их родных языках», — отметила директор по инновациям Mozilla Катарина Борхерт в блоге компании.