Amazon опубликовала датасет для распознавания речи на фоне шума

Оставить комментарий
Amazon опубликовала датасет для распознавания речи на фоне шума

Amazon открыла датасет Dinner Party Corpus (DiPCo), который помогает решить проблему «эффекта вечеринки» — восприятия и распознавания речи сразу нескольких спикеров в шумном месте, пишет VentureBeat.

Датасет помогали создавать волонтёры, которые имитировали шумные вечеринки в лаборатории — они ели и общались на фоне музыки. На каждого были надеты наушники с микрофонами, который улавливал сигнал определённого человека. Ещё 5 устройств 7 микрофонами были расположены в самом помещении и собирали сигнал на ноутбук координатора.

DiPCo содержит необработанные аудиозаписи со всех этих микрофонов. Записи, собранные с носимых микрофонов, позволяют определить успешность распознавания того или иного спикера. Кроме того, датасет содержит подробную расшифровку реплик каждого волонтёра.

Разделение данных на сегменты с и без фоновой музыки позволит исследователям совмещать «чистые» и «шумные» обучающие данные любым необходимым способом, чтобы достичь оптимальной производительности систем машинного обучения, считают авторы датасета.

По теме
Все материалы по теме

Хотите сообщить важную новость? Пишите в Телеграм-бот.

А также подписывайтесь на наш Телеграм-канал.

Читайте также

Илон Маск стал вторым в рейтинге миллиардеров, обошёл Билла Гейтса
Илон Маск стал вторым в рейтинге миллиардеров, обошёл Билла Гейтса
Илон Маск стал вторым в рейтинге миллиардеров, обошёл Билла Гейтса
2 комментария
ЕС взялся за американский Big Tech. Разбор
ЕС взялся за американский Big Tech. Разбор
ЕС взялся за американский Big Tech. Разбор
Европейская комиссия предлагает серьёзно пересмотреть цифровое регулирование. Закон о цифровых услугах (DSA) должен быть представлен в начале декабря — для Европы он станет первым в своем роде с 2000 года. Изменения в случае принятия могут драматично повлиять на Big Tech.  Разберёмся, что предлагает изменить новый закон, как это связано с пользовательским контентом и почему это «удар под дых» для медиагигантов.
2 комментария
Подборка сервисов по расшифровке аудио от Самата Галимова
Подборка сервисов по расшифровке аудио от Самата Галимова
Подборка сервисов по расшифровке аудио от Самата Галимова
Amazon отсадит токсичных игроков
Amazon отсадит токсичных игроков
Amazon отсадит токсичных игроков
1 комментарий

Обсуждение

Комментариев пока нет.
Спасибо! 

Получать рассылки dev.by про белорусское ИТ

Что-то пошло не так. Попробуйте позже