OpenAI запускает образовательную программу по обучению с подкреплением

9 ноября 2018, 12:04
OpenAI запускает образовательную программу по обучению с подкреплением

Исследовательская компания OpenAI анонсировала программу Spinning Up для желающих освоить технологию глубокого обучения с подкреплением, пишет VentureBeat.

Программа Spinning Up включает ряд значимых исследовательских работ в области обучения с подкреплением, глоссарий ключевых терминов и набор алгоритмов для практических упражнений.

Её задача — не только помочь изучить принципы технологии, но и способствовать достижению общей цели OpenAI — созданию и развёртыванию безопасного искусственного интеллекта путём вовлечения в процесс большего количества людей из иных сфер помимо компьютерных наук.

«Проблема безопасного ИИ потребует специалистов с широким кругом умений, а многие важные профессии не имеют никакой связи с проектированием или информатикой. Однако всем, кто будет участвовать в решении вопросе, понадобится узнать о технологии достаточно, чтобы принимать информированные решения. Именно для этого предназначены отдельные модули Spinning Up», — говорят авторы программы.

Ещё одна причиназапуска программы — отсутствие единого исчерпывающего пособия, которое содержало бы весь объём знаний, необходимых для реализации обучения с подкреплением. Сегодня эта информация разбросана в ряде лекций и влиятельных научных работ.

«Наша программа — недостающее звено для людей, которые увлекаются обучением с подкреплением и желают научиться использовать его для чего-то значимого, но не имеют ясного понимания, что изучать или как превращать алгоритмы в код», — написано на странице проекта.

Также OpenAI планирует провести воркшоп по Spinning Up в феврале 2019 года и ещё одно мероприятие совместно с центром по изучению ИИ (Center for Human-Compatible AI) Калифорнийского университета в Беркли.

Обучение с подкреплением — один из способов машинного обучения, в ходе которого система обучается, взаимодействуя с некоторой средой, и получает отклик от неё на принятые решения в виде сигналов подкрепления. Технология применялась, например, в проекте AlphaGo от DeepMind и при тренировке алгоритмов для игры в Dota 2.

подписка на главные новости 
недели != спам
# ит-новости
# анонсы событий
# вакансии
Обсуждение