Google выпустила новый диалоговый датасет для обучения виртуальных ассистентов

1 комментарий
Google выпустила новый диалоговый датасет для обучения виртуальных ассистентов

Исследователи Google опубликовали датасет Schema-Guided Dialogue (SGD) — крупнейший из находящихся в открытом доступе набор диалогов, разбитых по тематикам, пишет VentureBeat.

По словам исследователей, сегодня происходит интеграция голосовых ассистентов вроде Google Assistant со всё новыми сервисами в самых разнообразных сферах деятельности. Датасет должен способствовать обучению систем, способных поддерживать эти сервисы без необходимости дополнительно собирать данные или заново тренировать модель, а также снижению затрат на их дальнейшее развитие.

SGD содержит 18 тысяч проблемно-ориентированных размеченных диалогов между людьми и виртуальным ассистентом и может применяться для таких задач, как прогнозирование интентов пользователя, парсинг семантики, анализ диалога, синтез речи и других. Диалоги представлены по 17 различным темам, включая СМИ, банки, мероприятия, календарь, путешествия и погоду. Как отмечают авторы, это первый датасет, охватывающий такое количество областей и имеющий по нескольку API для каждой из них.

Подробно о SGD можно узнать в блоге Google. Исследовательская работа представлена на arXiv, исходный код доступен на GitHub.


Работа в ИТ в Беларуси​.​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​

1. Заполните анонимную форму — 5 минут.
2. Укажите зарплатные (и другие) ожидания.
3. Выберите желаемую индустрию или область деятельности.
4. Получайте релевантные предложения​​.​​​

Хотите сообщить важную новость?

Пишите в наш Телеграм

Читайте также

В Англии спущен на воду автономный корабль под управлением AI
В Англии спущен на воду автономный корабль под управлением AI
В Англии спущен на воду автономный корабль под управлением AI
3 комментария
Китай составил «черный список» технологий на экспорт
Китай составил «черный список» технологий на экспорт
Китай составил «черный список» технологий на экспорт
Голосовой ассистент Huawei будет работать на платформе «Яндекса» в России
Голосовой ассистент Huawei будет работать на платформе «Яндекса» в России
Голосовой ассистент Huawei будет работать на платформе «Яндекса» в России
Самые популярные сайты 1993-2020
Самые популярные сайты 1993-2020
Самые популярные сайты 1993-2020
1 комментарий

Обсуждение

0

Два индуса в разделе "Research" написали про ИИ в 2019 :)
Разложили вход на три уровня сложности и дали соответственные результаты:
- текстовые переменные и геолокация -> тупо реклама
- запрос уровня пожелания ребенка "я хочу" -> лид с учетом рейтинга
- запрос типа "а не спустить ли нам сегодня полтос" -> лид на чек и, возможно, на убер поездку домой и т.д.

Спасибо! 

Получать рассылки dev.by про белорусское ИТ

Что-то пошло не так. Попробуйте позже