IBM открыла датасет для обучения AI программированию

IBM представила датасет CodeNet, который исследователи могут использовать для создания интеллектуальных систем, способных транслировать код между языками программирования, анализировать и генерировать код, пишет ServerNews.

Оставить комментарий
IBM открыла датасет для обучения AI программированию

IBM представила датасет CodeNet, который исследователи могут использовать для создания интеллектуальных систем, способных транслировать код между языками программирования, анализировать и генерировать код, пишет ServerNews.

CodeNet представляет собой коллекцию из 14 млн образцов кода, решающих более 4 тысяч различных задач. Источником кода стали два японских конкурса по программированию — Aizu и AtCoder.

Суммарно набор насчитывает около 500 млн строк кода более чем на 55 языках — от современных, таких как C++, Java, Python и Go, до устаревших вроде COBOL, Pascal и FORTRAN. Более трёх четвертей массива приходится на С++ и Python. Помимо этого, код содержит метаданные и аннотации, уточняющие размер кода, расход памяти, процессорного времени, ошибки и другую информацию.

IBM рассчитывает, что проект поспособствует развитию AI-моделей, умеющих распознавать структуру программ, и станет своего рода аналогом базы ImageNet, которая считается стандартом в распознавании изображений и машинном зрении. Предполагается, что CodeNet будут использовать для создания интеллектуальных инструментов разработки для поиска нужных процедур в приложениях и библиотеках, перевода с одного языка программирования на другой, выбора правильных реализаций и отсева ошибочных, классификации кода и других задач.

Хотите сообщить важную новость? Пишите в Телеграм-бот.

А также подписывайтесь на наш Телеграм-канал.

Горячие события

Ярмарка вакансий Nordic Game Talents
27 октября — 29 октября

Ярмарка вакансий Nordic Game Talents

Читайте также

Британец получил штраф за нарушение ПДД: система перепутала номера машины с принтом на майке пешехода
Британец получил штраф за нарушение ПДД: система перепутала номера машины с принтом на майке пешехода
Британец получил штраф за нарушение ПДД: система перепутала номера машины с принтом на майке пешехода
Программирование на естественном языке сделает бум, а роторные движители поднимут. Техдайджест
Программирование на естественном языке сделает бум, а роторные движители поднимут. Техдайджест
Программирование на естественном языке сделает бум, а роторные движители поднимут. Техдайджест
Каждую неделю Александр Носков собирает новости технологий, видео и ссылки на полезные статьи.
Разработчик ИИ DeepMind впервые отчиталась о прибыли
Разработчик ИИ DeepMind впервые отчиталась о прибыли
Разработчик ИИ DeepMind впервые отчиталась о прибыли
Британский суд: AI не может быть автором патента
Британский суд: AI не может быть автором патента
Британский суд: AI не может быть автором патента

Обсуждение

Комментариев пока нет.
Спасибо! 

Получать рассылки dev.by про белорусское ИТ

Что-то пошло не так. Попробуйте позже