Отдел новостей 5 ноября 2018, 11:48

Google открыла код техники предобучения NLP-моделей BERT

Google опубликовала исходный код методики Bidirectional Encoder Representations from Transformers, которая позволяет тренировать модели обработки естественного языка (NLP) за 30 минут на одном облачном TPU (тензорный процессор Google) или за несколько часов — на одном GPU, пишет VentureBeat.

Релиз доступен на Github и содержит уже обученные языковые модели (на английском языке), а также сам код, построенный на основе фреймворка машинного обучения от Google TensorFlow. Помимо этого, методику можно найти на Colab — бесплатном облачном сервисе Google для разработчиков ИИ.

По словам исследователей Google AI, BERT уникальна тем, что она использует метод двунаправленной обработки, то есть учитывает предыдущий и последующий контекст слова, а также применима к немаркированным и неклассифицированным данным.

В тестах на понимание прочитанного по датасету Стэнфордского университета SQuAD, который базируется на вопросах по статьям Википедии, методика достигла точности в 93,2 процента и превзошла результаты людей (91,2 процента). В испытаниях на платформе General Language Understanding Evaluation, которая включает набор ресурсов для тренировки и анализа NLP-систем, точность BERT превысила 80 процентов.

Ранее Google открыла исходный код инструмента AdaNet для комбинирования алгоритмов МО и проекта ActiveQA, задача которого — повысить качество ответов ИИ-агентов.

Оставить комментарий

Текст: Отдел новостей Фото: VentureBeat Источник: dev.by Теги: google, обработка текста, машинное обучение, открытый исходный код

Нашли ошибку в тексте-выделите ее и нажмите Ctrl+Enter. Нашли ошибку в тексте-выделите ее и нажмите кнопку «Сообщить об ошибке»."

Сайт компании Вакансии

Размещение рекламы

10+ сертификаций Coursera, которые могут изменить вашу карьеру

Бюджетный способ прокачать навыки и повысить зарплату — это профессиональный сертификат от Google, IBM или крупного зарубежного университета. На Coursera как раз можно найти десятки полезных обучающих программ по машинному обучению, проджект-менеджменту и не только. Собрали 10+ сертификаций, которые будут выигрышно смотреться в резюме как новичка, так и опытного специалиста.

Дизайн, VR и интернет вещей: 10 доступных онлайн-курсов от Google, Amazon и других гигантов

На платформе Coursera можно найти сотни курсов от крупных корпораций, включая Google, Amazon и HubSpot. Это отличная возможность начать новую карьеру, повысить квалификацию и просто получить плюс в профессиональную карму. Мы собрали 10 программ от ИТ-компаний, которые помогут освоить машинное обучение, UX-дизайн, продакт-менеджмент, кибербезопасность и многое другое.

TinyML, No-code и обучение с подкреплением: новейшие тренды в машинном обучении

Пока 20% топ-менеджеров утверждают, что машинное обучение является существенной частью их бизнеса, неудивительно, что стоимость мирового рынка машинного обучения, по некоторым оценкам, достигнет $117 млрд к концу 2027 года. Мы перевели материал Udacity о семи самых обсуждаемых тенденциях в машинном обучении в 2022 году.

Google урезает бюджеты, СЕО намекает на сокращения

1 комментарий

Хотите сообщить важную новость? Пишите в Telegram-бот

Главные события и полезные ссылки в нашем Telegram-канале

Комментируйте без ограничений

Релоцировались? Теперь вы можете комментировать без верификации аккаунта.

Комментариев пока нет.

Войдите, чтобы оставить комментарий