GitHub: NumPy и SciPy — самые популярные библиотеки для ML-проектов

25 января 2019, 11:08
GitHub: NumPy и SciPy — самые популярные библиотеки для ML-проектов

Вслед за октябрьским отчётом Octoverse, GitHub опубликовал список инструментов, которые стали наиболее популярны среди исследователей искусственного интеллекта и дата-сайентистов в 2018 году.

GitHub учитывал информацию о коммитах, вопросах и пулл-реквестах за период 1 января по 31 декабря 2018 года. Среди репозиториев с тегом «машинное обучение» самым популярным языком программирования стал Python, который, к тому же, является 3-м по частоте использования языком на платформе в целом. На второй строчке с небольшим отрывом расположился С++, а за ним следуют JavaScript, Java, C#, Julia, Shell, R, TypeScript и Scala.

Что касается библиотек, безоговорочным лидером стала NumPy, поддерживающая высокоуровневые математические функции для работы с многомерными массивами. Её используют почти 3 четверти ИИ-проектов GitHub. Также в число самых востребованных библиотек вошли библиотека для научных и инженерных расчётов SciPy, Pandas для обработки и анализа данных и Matplotlib для визуализации данных. Замыкает топ-5 библиотека scikit-learn.

Самыми популярными ML-проектами с открытым кодом стали разработанный Google фреймворк TensorFlow, scikit-learn и два проекта, связанных с обработкой естественного языка: explosion/spaCy и RasaHQ/rasa_nlu. Следующие 4 по популярности проекта связаны с обработкой изображений: CMU-Perceptual-Computing-Lab/openpose, thtrieu/darkflow, ageitgey/face_recognition, и tesseract-ocr/tesseract.

Обсуждение