Google выпустила новый диалоговый датасет для обучения виртуальных ассистентов

Оставить комментарий
Google выпустила новый диалоговый датасет для обучения виртуальных ассистентов

Исследователи Google опубликовали датасет Schema-Guided Dialogue (SGD) — крупнейший из находящихся в открытом доступе набор диалогов, разбитых по тематикам, пишет VentureBeat.

По словам исследователей, сегодня происходит интеграция голосовых ассистентов вроде Google Assistant со всё новыми сервисами в самых разнообразных сферах деятельности. Датасет должен способствовать обучению систем, способных поддерживать эти сервисы без необходимости дополнительно собирать данные или заново тренировать модель, а также снижению затрат на их дальнейшее развитие.

SGD содержит 18 тысяч проблемно-ориентированных размеченных диалогов между людьми и виртуальным ассистентом и может применяться для таких задач, как прогнозирование интентов пользователя, парсинг семантики, анализ диалога, синтез речи и других. Диалоги представлены по 17 различным темам, включая СМИ, банки, мероприятия, календарь, путешествия и погоду. Как отмечают авторы, это первый датасет, охватывающий такое количество областей и имеющий по нескольку API для каждой из них.

Подробно о SGD можно узнать в блоге Google. Исследовательская работа представлена на arXiv, исходный код доступен на GitHub.


Работа в ИТ в Беларуси​.​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​

1. Заполните анонимную форму — 5 минут.
2. Укажите зарплатные (и другие) ожидания.
3. Выберите желаемую индустрию или область деятельности.
4. Получайте релевантные предложения​​.​​​

Хотите сообщить важную новость? Пишите в Телеграм-бот.

А также подписывайтесь на наш Телеграм-канал.

Читайте также

Google опубликовала требования к разработчикам для снижения комиссии
Google опубликовала требования к разработчикам для снижения комиссии
Google опубликовала требования к разработчикам для снижения комиссии
Amazon остается самым дорогим мировым брендом. Tesla бьет рекорды
Amazon остается самым дорогим мировым брендом. Tesla бьет рекорды
Amazon остается самым дорогим мировым брендом. Tesla бьет рекорды
Бигтех сливает данные правоохранителям и госслужбам
Бигтех сливает данные правоохранителям и госслужбам
Бигтех сливает данные правоохранителям и госслужбам
Google закрыла центр для стартапов в Лондоне: из-за пандемии он стал не нужен
Google закрыла центр для стартапов в Лондоне: из-за пандемии он стал не нужен
Google закрыла центр для стартапов в Лондоне: из-за пандемии он стал не нужен

Обсуждение

Комментариев пока нет.
Спасибо! 

Получать рассылки dev.by про белорусское ИТ

Что-то пошло не так. Попробуйте позже