DataFest'2018: зачем делать бесплатную конференцию и причём здесь открытый код

25 мая 2018, 11:40

В минском ОК16 прошел Data Fest² – вторая неформальная конференция разработчиков и исследователей в сфере data science, «праздник данных и угарная тусовка», организованная командой SPACE. В этот раз была выбрана площадка на заводе МЗОР в 1300 квадратных метров, поскольку желающих поучаствовать было в два раза больше, чем в прошлом году. Один из организаторов мероприятия Алексей Натекин (основатель сообществ Open Data Science, DataSouls) рассказал dev.by, почему его сделали бесплатным и как открытый код помогает технологиям.

Читать далее

Data Fest задумывали и развивали как мероприятие от сообщества и для сообщества. Это площадка для специалистов в конкретной области, где можно узнать лучшие последние достижения, обменяться опытом, и куда важнее — познакомиться и пообщаться с братьями/сёстрами по духу и интересам. Мероприятие организовали прежде всего для развития общего для участников профессионального сообщества, а уже после — для популяризации машинного обучения и анализа данных.

Делать Фесты бесплатными — идеологическое решение. Это сложно, но, к счастью, сообщество быстро осознало ценность таких мероприятий, а разные компании быстро присоединились в качестве партнёров и спонсоров. Это очень важный момент — бизнес осознал, что он тоже является частью большого профессионального сообщества. И он готовы поддерживать независимые, общие для всех экосистемные мероприятия — от наличия подобных площадок выигрывают все.

Идеологический выбор оправдал себя и во многом повторяет судьбу другой вещи, где слово «открытый» сыграло важную роль — открытого кода. Если 10 лет назад проприетарные решения, инструменты и библиотеки по анализу данных и машинному обучению правили бал, то сегодня они банально не могут конкурировать с лидерами в Open Source.

За то время, пока крупный вендор выстроит последний state of the art в том же компьютерном зрении, этот передний край уйдет вперёд года на 3 (за счет того, сколько времени потребуется на эту реализацию). Открытые инструменты живут своей бурной жизнью, их применяют все — тут возникает обратная ситуация, когда лучшие модели оказываются в открытом доступе за полгода до их публикации (!). А самые сознательные компании и вовсе решили возглавить этот процесс: они публикуют и вместе с сообществом доделывают собственные инструменты — первыми приходят на ум tensorflow и pytorch.

При всём этом, крупные бесплатные конференции наподобие Data Fest ещё и держат марку качества. Благодаря тому, что мы делаем конференцию «как для себя», удаётся собрать самые лучшие доклады и докладчиков с передовыми результатами. Концепция Феста повторяет путь развития машинного обучения, но уже в научных публикациях: если раньше практически не было выбора с публикацией в дорогостоящих журналах, то сейчас передовые и ведущие журналы и конференции — ICML, ICLR, NIPS — публикуют всё в бесплатном доступе.

Cпециалисты тоже не хотят, чтобы их результаты скрывались за paywall-ом. В итоге ситуация пришла к тому, что в подобных открытых источниках будут именно передовые результаты, а середнячок можно скрыть во всевозможных Elseveir, Springer и прочих, берущих по $20 за статью. С докладами на мероприятиях происходит похожая судьба — лучшие из них доходят до Феста, где ты перед всем сообществом делишься самым важным. А всё остальное, если очень надо, можно принести и на индустриальную «ярмарку-выставку».

Мероприятие поддержало 9 компаний, благодаря чему конференцию удалось оставить полностью бесплатной для посетителей. Генеральным партнёром выступила компания  Mapbox, а организаторами — сообщество Open Data Science и SPACE. Партнёры: Altoros, Appodeal, WorkFusion, velcom, Juno, Profitero, Bulba Ventures, Play2Live 

На датафесте собралось более 600 слушателей и 17 докладчиков — как белорусских, так и зарубежных. Конференция прошла в два потока, доклады разбили на тематические секции — машинное обучение в продакшене, компьютерное зрение, обработка естественных языков, соревновательный анализ данных. Видеозаписи всех докладов будут доступны после обработки; впрочем, самые любопытные уже могут ознакомиться с записью всего первого потока.

Обсуждение