Google выпустила датасет для тренировки продвинутых QA-систем

Оставить комментарий
Google выпустила датасет для тренировки продвинутых QA-систем

Google создала высококачественный корпус данных, включающий информационные запросы и ответы на них. Он предназначен для разработки вопросно-ответных (QA) систем, какие используются, например, в чат-ботах, сообщает VentureBeat.

Новый масштабный датасет Natural Questions для тренировки и оценки QA-систем, предполагающих владение общедоступными знаниями, Google представила в научной работе и блогпосте. По словам исследователей Google AI Language, инновационность разработки в том, что она целиком имитирует процесс поиска ответа на вопрос людьми.

Датасет состоит из более чем 300 тысяч запросов с аннотированными человеком ответами из Википедии. Его создавали на основе обезличенных запросов, собранных из поисковика Google, после чего аннотаторы должны были полностью прочитать статью энциклопедии и подобрать два варианта ответов: краткий и более развёрнутый. Оценочная точность аннотаций — 90 процентов.

Ранее Google открыла исходный код проекта ActiveQA для тренировки QA-агентов при помощи обучения с подкреплением, а также фреймворка BERT для обучения NLP-моделей на одном тензорном процессоре за 30 минут (или за несколько часов на нескольких GPU).

Хотите сообщить важную новость?

Пишите в наш Телеграм

Читайте также

В Android появился аналог AirDrop
В Android появился аналог AirDrop
В Android появился аналог AirDrop
Google презентовала смартфоны Pixel 4a
Google презентовала смартфоны Pixel 4a
Google презентовала смартфоны Pixel 4a
2 комментария
Google выпустила расширение для Chrome, которое «сдаёт» шпионящие сайты
Google выпустила расширение для Chrome, которое «сдаёт» шпионящие сайты
Google выпустила расширение для Chrome, которое «сдаёт» шпионящие сайты
Почему беспилотные стартапы всё никак не взлетят
Почему беспилотные стартапы всё никак не взлетят
Почему беспилотные стартапы всё никак не взлетят
Успехи разработчиков самоуправляемых автомобилей пока не оправдывают многие ожидания и обещания, данные несколько лет назад. Waymo очень старалась, но так и не успела запустить беспилотное такси к концу 2018 года, Cruise (дочка General Motors) передумала запускать аналогичный коммерческий сервис в 2019-м. Tesla снова и снова срывает амбициозные сроки разработки полноценного автопилота, которого расписывает Илон Маск. Издание Ars Technica рассказало о разных подходах к реализации технологий беспилотного вождения.
30 комментариев

Обсуждение

Комментариев пока нет.
Спасибо! 

Получать рассылки dev.by про белорусское ИТ

Что-то пошло не так. Попробуйте позже