Учёный из Института проблем информатики НАН: «Я ещё в 1990-х „юзал“ нейросети»

5 апреля 2017, 10:32

Василий Ковалёв, математик по образованию, начал заниматься анализом цифровых изображений в конце 1980-х, когда «ещё и цветных изображений-то не было». Он жил и работал в Южной Корее, Великобритании, Германии и Швеции, а в конце «нулевых» вернулся в Беларусь, где основал Лабораторию анализа биомедицинских изображений при Институте проблем информатики НАН Беларуси. В 2016 году алгоритм ранней диагностики рака с использованием глубинного обучения и нейросетей, разработанный Ковалёвым и двумя молодыми программистами, вошёл в мировой топ-4. В интервью dev.by кандидат технических наук, заведующий Лабораторией рассказал об удивительном пути в науке и ИТ.

Читать далее...

— Вы ещё и в садик не ходили, уже люди «юзали» нейросети. Я впервые начал использовать полносвязные свёрточные сети в 1993 году. Никто не знает, что у нас в Академии наук был такой проект — белорусский нейрокомпьютер. Энтузиасты из Института проблем информатики вступили в дружески-научные отношения с немецким университетом Мангейма, куда мы ездили (и до сих пор ездим) ума набраться, пива попить и швабский бифштекс съесть. Не удивлюсь, если где-то глубоко в подвале стоит этот старинный белорусский нейрокомпьютер. Эх, если бы у нас тогда были сегодняшние технологии и «железо»!

Предыстория: анализ цифровых изображений в 1980-х, примитивные сканеры и самопальные платы

— Сталин умер, лагерь развалили, а на его месте домишки построили, — Василий Ковалёв вспоминает, как в 1950-х перебрался вместе с родителями из-под Могилёва в Казахстан, к дяде. Жили на месте бывшего лагеря Песчаный, он же Особый N11, он же Дальлаг, о котором писал Солженицын и пел Высоцкий. Закончил там школу и «уехал в романтические места» — Сибирь, поступив Томский политехнический институт по специальности «Прикладная математика», где затем довольно долго преподавал. Но «хотелось домой». Вернулся в Минск, в Институт математики НАН Беларуси, в статусе приглашённого специалиста, сразу получив квартиру «навырост».

Лихие 1990-е учёный провёл не в электричках «Брест-Белосток», как приличная часть страны, включая научное сообщество, а в Южной Корее — на научно-техническом проекте своего профиля.

— Я «прильнул» к анализу цифровых изображений в конце 1980-х, когда трудно было получить цифровое изображение как таковое. Были примитивные сканеры и самопальные платы, цифровавшие телесигнал. За счёт проектов в Южной Корее мы потом очень поднялись, получили новейшее оборудование.

После падения «железного занавеса» белорусский учёный начал выезжать в Европу и вскоре перевёз туда семью. В Германии, Великобритании и Швеции Ковалёвы прожили 8 лет. Василий Алексеевич работал в немецком Институте человеческой когнитологии и науки о мозге общества Макса Планка, по его словам, одном из четырёх самых авторитетных учреждений такого профиля в мире. Затем в двух британских университетах — Имперском колледже Лондона  и Университете Суррея (оба в топе самых престижных вузов Великобритании). Выступал на конференциях в Кембридже и Оксфорде. И, наконец, получил приглашение на работу в Монреальский институт нейрологии. Однако вернулся на родину. В 2007 году он основал в Институте проблем информатики НАН Беларуси Лабораторию анализа биомедицинских изображений. «Где с тех пор и процветаем», — заключает Ковалёв.  

Алгоритм диагностики рака: в мировом топ-4

Время от времени Василий Алексеевич и его команда молодых программистов пробуют силы в международных конкурсах на стыке науки и ИТ. Обычно — в свободное от основных рабочих проектов время и бесплатно.

— Это соревнования по какой-либо сложной проблеме, от разработки автопилотов до диагностики болезней. Часть с призовыми фондами до $1 млн, часть —  без. IBM как-то устраивала соревнование на базе своего суперкомпьютера и прислала мне Apple Watch. Сыну подарил: этот белый металл терпеть не могу, как корыто оцинкованное. Но если в таком конкурсе вы попали хотя в десятку призёров, то поиск работы с такой строчкой в CV превращается в сплошное удовольствие.

В 2016 году команда Ковалёва участие в международном конкурсе Tumor Proliferation Assessment Challenge 2016 (TUPAC16). Группы учёных и программистов из более чем 100 стран мира соревновались в разработке алгоритмов ранней диагностики рака. В одной из номинаций белорусы вошли в топ-4, обойдя, к примеру, Университет Южной Флориды (США), Технический университет Мюнхена (Германия), Уорикский университет (Великобритания).

Работа над алгоритмом заняла 4-5 месяцев. Завлаб Василий Ковалёв отвечал за идеи и руководил процессом, научный сотрудник Александр Калиновский занимался нейросетями, младший научный сотрудник Виталий Левчук программировал скрипты и готовил выходные данные.  Кстати, в начале 2017 года Александра «похитили из института» — в стартап Виктора Прокопени Banuba, делающий ставку на исследования и создание комплексных технологий в области компьютерного зрения и дополненной реальности.

Как это сделано: можно обойтись без программирования, если не лезть «в потроха»  

Все команды-участники должны были проанализировать 500 цветных изображений опухолевой ткани рака груди. Эти снимки предоставила Голландия, они сделаны дорогостоящими — до $200 тысяч — сканерами с использованием очень большого увеличения (полнослайдовые изображения). В Беларуси, например, таких сканеров ещё нет.

По сути, нужно было научить алгоритмы предсказывать одну из важнейших характеристик опухоли — степень её агрессивности. То есть найти коэффициент скорости деления клеток, Tumor Proliferation Index (TPI). «Это очень трудная задача: у разных людей даже один и тот же тип опухоли развивается с разной скоростью», — объясняет Ковалёв. Однако нейросети в перспективе смогут справляться с этим «быстрее и лучше ведущих мировых врачей», уверен учёный. Уже сейчас на конференциях врачей-радиологов (рентгенологов) — одной из самых высокооплачиваемых врачебных специализаций в США — разворачиваются дискуссии на тему будущей безработицы.  

Белорусская команда применила два подхода: «по старинке» (Василий Алексеевич сам разрабатывал дескрипторы изображений) и нейросети. Во втором случае использовались методы глубинного обучения и базовые фреймворки Tensor Flow, Caffe.

— Чисто технически можно делать это по-разному. Если поверхностно, то вот один из вариантов: берёте оболочку от Nvidia, внутри которой спрятан фреймворк типа популярного Caffe. Разбрасываете свои изображения по нужным директориям, после чего свёрточные сети сами вытягивают вектор признаков, описывающих изображения. Можно обойтись почти без программирования. Но если хотите залезть внутрь, в «потроха», и достать эти признаки, то должны программировать на чём-нибудь (как правило, на Python). После этого признаки анализирует полносвязная сеть-классификатор типа SVM. Их сейчас море. Ну и чтобы решить громадную задачу оптимизации, нужен или суперкомпьютер, или продвинутая графическая карта. Купили 5 штук Titan X (у каждой на борту 12 Гб быстрой памяти и 3000 ядер), хотя в Беларуси они такие дорогие, что просто жалко.

Результаты работы команда из Института проблем информатики НАН опубликовала на международном портале ResearchGate. Подробное описание можно посмотреть здесь.

А здесь Ковалёв и его команда сравнивают эффективность различных фреймворков глубинного обучения, с точки зрения скорости и точности.

Самая скачиваемая научная работа из Беларуси в 2016-м: качают американцы, китайцы и индусы

Материал про эффективность разных фреймворков вошёл в число самых читаемых работ второй половины 2016 года из Беларуси с количеством загрузок 40-400 в неделю.

— Как думаете, кто чаще скачивает? США, Китай и Индия. Я бывал в Индии, они народ без комплексов и с хитростью, опасные ребята с точки зрения конкуренции. Если они уже осознают значимость научных исследований на стыке с ИТ, то у нас осталось немного времени, чтобы тоже это сделать. Пока же наш хай-тек — не совсем high. Аутсорс, конечно, тоже хорошо, пилишь «от сих до сих», получаешь деньги, всё по-честному. Но будущее — за топовым научным продуктом.

Академия наук тоже заметила результат, включив разработку в топ-10 за 2016 год. Авторам достался «тяжеленный кубок» и около $1000 на троих.

Получится ли из этого научно-инженерный стартап?

Алгоритм — в бесплатном доступе: академическая наука «разрабатывает не заказчику, а для человечества». Можно ли сделать на его основе научно-инженерный стартап, на нехватку которых жалуется, например, Юрий Гурский?

— Именно с этим алгоритмом мы не были первыми или даже десятыми: таких стартапов уже как грибов. Западные университеты нередко дают команде помещение, платят зарплату и ничего не просят в ответ. Есть идея сделать кое-что другое для белорусского рынка: «софтину», которая обнаруживала бы новообразования в лёгких на очень ранней стадии, одиночные «шарики». В госпиталях на Западе их уже ищут автоматически. Рак лёгких — это же киллер №1, особенно среди мужчин.

Правда, пока Василий Алексеевич не встречал инвесторов, которым это было бы интересно: «Они все хотят вложить рубль и получить два, что в общем-то тоже правильно. Но они не хотят платить за науку».

Сканеры за $200 тысяч: почему алгоритм не будет работать в Беларуси

В Беларуси пока нет сканеров, позволяющих оцифровывать образцы ткани в очень высоком разрешении. Они появятся, «когда наше здравоохранение будет богатым». Неподалёку, в Вильнюсе, такое оборудование есть, так что в планах — поработать с литовцами.

— Знаю единственный случай, когда такие изображения были сделаны в Беларуси. Года 4 назад фирма Leica выставляла тут медтехнику, мы договорились с ними и отсканировали свои образцы тканей. В другой раз я пробовал написать в японское посольство, чтобы получить такую машинку «на халяву», но у них бахнула Фукусима, стало не до того. А как-то недавно мне позвонил заведующий патологоанатомической лабораторией Минского городского онкодиспансера Михаил Валерьевич Фридман: зайди, говорит, что-то покажу, ты «завянешь». Захожу и вижу полнослайдовые изображения — совместный проект с японцами. А я уже видел такое в Минске, меня этим не удивишь.

Однако сегодня эти сканеры — далеко не первичная потребность белорусской медицины, говорит Василий Ковалёв.

— Ребята из соседней лаборатории ставят госпитальные информационные системы — 250 компьютеров в одну поликлинику, плюс инфраструктура, плюс научить тётенек вставлять флешку нужной стороной. Представьте, сколько это денег. А ведь это просто база. Помню, Национальный институт здоровья США хотел выделить денег на компьютеризацию РНПЦ пульмонологии и фтизиатрии, но подсчитали — прослезились: не, мы не можем.

«Там я стал бы кем-то»: как отказаться от Монреаля и вернуться в Минск  

После 8 лет в Европе Василий Ковалёв «доблестно вернулся домой»:

— Как говорили на ток-шоу про ИТ в эфире «РТР-Беларусь», все едут в Лондон — а я оттуда вернулся. Привозить ребёнка в последних классах, что мы сделали, это почти самоубийство. Сын закончил английскую школу A-level, но поступать уехал в Германию. Жена тоже не нашла там себя. Ну и в Беларуси меня встретили с распростёртыми объятиями. Хорошо в Беларуси, мне нравится! Не надо просто ненужных мыслей в голову вбивать. И ездить надо много, общаться. Чтобы видеть мир и адекватно его себе представлять. А жить можно где угодно, особенно в ИТ: хоть на Гавайях, хоть в Швейцарии — очень она мне нравится. К слову, сейчас у нас заблокированы научные проекты Союзного государства (у меня их два), так я шучу, что не с тем государством у нас союзное государство: надо бы со Швейцарией, у неё деньги не кончатся никогда.

Пожив в пригороде Лондона Гилфорде, Ковалёв прочувствовал на себе всю справедливость анекдота про «не путай туризм с эмиграцией»:

— Это классный городок с самой высокой зарплатой по Британии. Сначала я приехал по работе, полгода жил в гостинице — тётеньки застилали кровати, вкусный завтрак. Тоска, правда, зелёная заела. Решил, что это идеальное место. И нарисовался уже с семьёй. И началось: кровать уже никто не застилает, зато аренда жилья очень дорогая, плати и туда и сюда, а потом ещё каждый месяц приходит счёт на $250 — за цветочки на клумбах и подметенные улицы.

Незадолго до возвращения в Минск он получил официальное приглашение на работу из Монреаля, где находится один из четырёх ведущих мировых «институтов мозга». Но отказался и до сих пор считает это решение правильным:

— Там я наверняка стал бы кем-то — а не как сейчас. Меня знало бы много людей. Но... решили не ехать. Опять всё сначала? Трудно это.

После того, как Василий Алексеевич завёл себе белорусский почтовый ящик вместо британского, его перестали приглашать выступить с лекцией или поработать: «А я же глупее не стал. Вот так устроена жизнь».

Оба сына Василия Ковалёва работают в ИТ. Один — в Минске, другой — в Париже.

Образование «не очень»: какие ИТ-реформы не получится провернуть быстро  

Василий Ковалёв не хочет делать никаких прогнозов, чем обернутся для белорусского ИТ обещания «зелёного света» на высшем уровне: «Я не лезу в это дело. Не хочу управлять государством». Он уверен в одном: не все нужные реформы можно осуществить быстро.

— Поменять законы в пользу ИТ — это быстро. А что-то нельзя сделать быстро. Вот образование. Оно у нас «не очень, чтобы очень». Кадры преподавательские пожилые и уходят. А новые не приходят. Плюс хронические проблемы с финансированием. Нельзя преподавателю работать за копейки! Человек останется либо потому, что его больше никто не возьмёт, либо потому что сверхэнтузиаст (такие бывают, но редко). Я довольно долго преподавал в Сибири, читал большие поточные лекции на 200-300 человек. Это тяжёлая работа.

Послевоенный СССР шёл грамотным путём, считает Ковалёв — инвестиции в образование, система отбора талантов: «Это работало. Как в песне, текли куда надо каналы и в конце куда надо впадали. Страна не была такой уж развитой, но конкурировала со всем миром, поскольку развивала образование системно. Такие системы создаются десятилетиями».

Белорусское ИТ-образование он тоже считает слишком сиюминутным, «уж очень конкретные знания вдалбливают, которые завтра будут на свалке».

— Какие наши годы, подождём! — и всё-таки учёный полон оптимизма.

Как поднималась Южная Корея: «Утром, ещё немытый, уже по клавишам бьёт»  

В 1990-е Ковалёв провёл год в Южной Корее. Уехать туда пришлось «от голодухи»:  

— Все ушли возить в Польшу розетки, вилки, а обратно — тряпки. Сейчас дико вспомнить. И тут корейцы решили замутить Советско-корейский центр научно-технического сотрудничества. В шикарном кампусе, который им оставили американцы после войны. Получили много денег, набрали команды, много советских специалистов пригласили. Мы взяли хороший проект, получили новейшее американское оборудование: zip-диски тогда только появились, и мы их сразу заказали из США. Набрались там ума. Научились работать по-корейски. Там тогда сурово было: утром весь институт строится и торжественно поднимает флаг, вечером — опускает. И это не Северная Корея, заметьте! Думаете, опустил флаг — и домой? Нет, если ты ушёл после 18.00, ты нехороший человек. Нужно родине дань отдать — ещё часа три. Молодежь вообще не уезжала домой, там же пробки: на тюфячок приляжет, утром — ещё немытый, а по клавишам уже бьёт.

Чужая культура всегда обогащает и полна сюрпризов — и не только научно-технического толка: «Несколько раз были в ситуации, когда 50 девушек выстраивались на выходе из магазина в шеренгу, все такие расфуфыренные, разодетые. Ты идёшь через эту шеренгу, а они по очереди кланяются. Меня аж в жар кинуло, мама родная! Когда в Гилфорд приезжала королева Елизавета на своё 80-летие, её как-то спокойнее встречали, чем меня в Корее».

Южная Корея — готовый мануал на тему «как правильно подниматься с колен», уверен Василий Алексеевич:

— Я наблюдал, как страна поднимается. Она же в 1950-1960-е была в диком состоянии. Потом шили куртки и мудро складывали денежки, потом собирали японские «видики», потом делали накопители и мониторы. Строили заводы, растили кадры, не стеснялись брать чужие технологии. И росли, росли. А то некоторые любят громкие лозунги и начинания, которые сводятся к «хотим всё сразу». Рост — это процесс долгий. Главное, с застоем не путать.

Институт проблем информатики НАН: инженер-программист получает 300 рублей

Перемен хочется и для Института проблем информатики НАН, ведь в каком-то смысле он тоже часть ИТ-индустрии страны.

— Но специфика его такая: нужно делать много работ, которые нужны государству, но они не являются ни наукой, ни бизнесом. Давать экспертизу разным проектам, программам. Примитивный пример: кто знает, сколько платят за интернет в разных странах мира? Институт! Хотя можно просто пойти на сайт Deutsche Telekom и узнать тарифы.

Василий Ковалёв делится «очень частным мнением» о том, что на этой почве институт расслоился:

— Часть лабораторий ушла туда, куда государство явно и неявно направляет: внедрение в производство. Официальные документы требуют, чтобы учёный шёл на конвейер налаживать что-то. Такому учёному не до науки, если честно. Зато эти лаборатории делают конкретные дела и зарабатывают конкретные деньги. (У нас жёсткий хозрасчёт, мы финансово изолированы: к примеру, у меня нет денег, а через стенку — завались, но мне их всё равно не дадут). А те, кто остался в науке, живут на зарплату. Знаете, какой оклад у инженера-программиста из соседней комнаты? 200 рублей. Со всеми мыслимыми законными добавками — 300 рублей. А потом приходит пресса или начальники и говорят: когда стране угля дадите? В том же Институте Макса Планка никто не обязывает «внедрить, на конвейер поставить, догнать, перегнать», но институт имеет солидный бюджет и лучшие мировые результаты во многих областях. И, кстати, там я писал один отчёт за год, и тот на полстраницы, а не производил бумагу.

Лаборатория Ковалёва «пытается балансировать»:

— Сами понимаете, чудес не бывает: где-то не успеваешь. Но нередко результаты очень значимые, хотя мы даже не всегда про них узнаём. Например, есть такая толстая красивая книга о передовых методах анализа медицинских изображений, для которой мы написали главу. Случайно нагуглил: в Калифорнии, в медицинском университете, эта глава входит в список обязательной литературы. Приятно: здесь даже не знают о её существовании, а там это учебник.

ПВТ «похищает» кадры: мы что вам тут, HR-агентство?

— Странная у Института сейчас позиция: жёсткая и неравная конкуренция с ИТ-компаниями. Не хотят у нас работать — денег мало. Студенты подтягивают уровень во время преддипломной практики — и врассыпную. Из-за этого я даже отказался от дипломников: какой смысл? А ещё Европа многих аспирантов забрала. Вначале отдавали, а потом сказали: мы что вам тут, HR-агентство? Мне не хочется быть эйчаром. Теперь мы говорим: хочешь заниматься наукой, диссертацией — пожалуйста. Но работать не разрешаем. Иначе ты ни там, ни там. Ну а старшее поколение, если честно, дорабатывает в науке, потому что его в ПВТ не возьмут.

Впрочем, процесс оттока из науки, по его словам, идёт и в Европе, сбегают «на фирмы», не защитив диссертацию: «Эта плесень много кого поразила».

Финансирование: сбор средств в пользу голодающих учёных

В эфире ток-шоу на «РТР-Беларусь» Василий Ковалёв успел сказать, что денег не хватает, но микрофон у него сразу забрали.

— Если мы посчитаем, сколько денег от общего объёма у нас реально идёт в науку, то прослезимся и объявим сбор средств в пользу голодающих учёных. Я высокой политикой не занимаюсь, но думаю, что одна из реформ очевидна: надо цифры финансирования науки и исследований подтянуть к тем, что на Западе, они ведь известны.

Кстати, если лаборатория получает доходы из совместных с Западом проектов, «этому не всегда рады: что-то многовато!». А некоторые проекты такого рода стали невозможны после того, как Беларусь вышла из соответствующих соглашений.

— Беларусь состояла в ассоциации, которой Запад платил деньги, — Международный научно-технический центр. За их деньги оснастили наш детский онкоцентр, Минский онкодиспансер купил цифровой микроскоп Leica. А у меня был хороший проект на полмиллиона евро, со всеми академическими свободами и нормальным финансированием труда людей. Однако мы взяли и с гордо поднятой головой вышли из этого соглашения (вслед за Россией), не нужны нам ваши деньги поганые. К сожалению, мы не всегда делаем правильные вещи вслед. От института мы даже написали письмо, что мы против выхода из соглашения, — говорит Ковалёв.

Приход Года науки, по его наблюдениям, пока выражается только в одном: журналисты чаще звонят.

«Овцы-волки»: всегда ли белорусский айтишник будет сытым и обутым?

Василий Алексеевич отмечает «напряжение» между белорусскими айтишниками и «неайтишниками»:

— Те нападают, эти отбиваются: у вас зарплата ни за что, а я у станка стою и получаю пшик. Нехорошая ситуация, но уж как есть. Многие люди думают: завтра будет как сегодня. Ничего подобного. Всё обязательно изменится. И в ИТ тоже. Никогда так не бывает, чтобы всё было как всегда. Может, в обозримом будущем зарплата у айтишника будет как у водителя троллейбуса? Возьмите простейшую имитационную модель «овцы-волки»: сначала одних становится меньше, потом других. Это колебательный процесс. Было мало программистов — подтянулись индусы, китайцы, румыны, болгары, наши. А кого теперь не хватает? Инженеров-механиков. А механика из жизни не уходит — вот даже стул вертящийся надо спроектировать.

Про возраст в професии: в 60 лет у нас человек никто   

После Нового года белорусские разработчики алгоритма съездили «ума набраться» в Германию, к коллегам из Немецкого центра исследования рака (DKFZ), отделение биоинформатики (Биоквант), которые обошли их во время соревнования. Там Василий Алексеевич «решил порезвиться по старой памяти» и накодил полторы тысячи строк на С, рассмешив молодёжь, вспоминает он.

— Как в нашей области без языков программирования? Но у нас не промышленное программирование, а «пробное»: ведь нигде нет мануала, как написать программу, анализирующую томограммы мозга. Это же не кефир с завода по магазинам развозить. Поэтому мы много пишем, переписываем, выбрасываем, а если метод работает, то его уже можно закодить прилично, «отлить в металл». Если я перечислю свои языки программирования, то список будет длинный и смешной, начиная с Ассемблера и Кобола и заканчивая С и Python.

В программисты, однако, он бы не пошёл: «Профессия коварная. Троллю иногда айтишников: вы же кодеры! Кодер в 25 — ок, в 30 более-менее, в 35 — подозрительно, в 40 — это уже просто неприлично. А в науке можно быть долго». Зато охотно бы поработал в компаниях ПВТ в качестве менеджера, но не верит, что человека в его возрасте возьмут на такую работу в Парк.

— Это в Великобритании ты в 92 года ещё молодец, а у нас в 60 — никто. Я мог бы быть менеджером в ПВТ или поискать нужные для компаний проекты, людей. Я умею общаться с людьми, как на Западе принято. Но если я приду на собеседование, меня засмеют. Перед поездками на международные конференции и выставки лучше наймут девочек из института физкультуры — они никто в ИТ, но их приятно показать миру.

Беларусь в глобальном мире: попить пивка и начать прорывной проект

— Мы сейчас не так сильно от мира отличаемся, — размышляет заведующий лабораторией анализа биомедицинских изображений, которому есть с чем сравнивать. — Если пройтись по коридорам, то сильно (хорошо, что мои западные партнёры никогда не видели пол в моём кабинете), но в мозгах и в душе — уже не так. Новое поколение продвинутое, шустрое, английский знает. Без английского ведь все двери закрыты. Как оно в жизни делается? С человеком знакомишься, говоришь. Он видит, что ты не дурак, а ты видишь — что он. И что-то получается. Сходили пивка попить со шведами — получился серьёзный проект, улучшающий мир не на словах, а на деле. Сейчас вот ведём переговоры в Skype с госпиталем в Барселоне, может, съездим летом. Там очень толковые специалисты — и весёленькие такие!

 

Фото: Андрей Давыдчик, dev.by

 

Обсуждение