«Пока этические проблемы не решены, не стоит создавать условия, в которых ваш код будет открыт». Вычислительный биолог о программировании вирусов, клетках-зомби и вечной жизни

17 апреля 2019, 08:32
Артур Якимович (слева) с командой и роботизированными микроскопами в Цюрихе

Артур Якимович (слева) с командой и роботизированными микроскопами в Цюрихе

Артур Якимович — научный сотрудник Лаборатории молекулярной клеточной биологии при Медицинском исследовательском совете Великобритании. Белорус занимается вычислительной биологией, исследует скрытое взаимодействие между хозяином (человеком) и патогеном (вирусом) и активно применяет в работе AI.

Артур, объясните, чем вы занимаетесь и как это связано с искусственным интеллектом.

Эта область зародилась в 80-х как классическая биоинформатика из секвенирования, работы с последовательностями ДНК. Потом сюда подключилась биофизика, которой понадобилось огромное количество симуляций биопроцессов. Сейчас область называется более обобщающим термином — вычислительная биология.

В биологических изображениях, полученных с помощью микроскопа, содержится огромное количество информации. И с каждым днём её становится всё больше, потому что методы получения — аппаратная часть и программная — постоянно улучшаются. Такой объём информации не под силу обработать человеку. Поэтому мы используем современные методы анализа, такие как ML и вычислительные методы.

В 2011 году я принимал участие в проекте швейцарского консорциума SystemsX по биологическому скринингу патогенов, где мы выключали и включали некоторые гены в экспериментальных человеческих клетках и смотрели, как это влияет на инфекцию различными патогенами. В этом эксперименте нам необходимо было анализировать сотни тысяч изображений клеток. Начинали мы с методов, связанных с так называемыми SVM (support vector machine). Да, это далеко не свёрточные сети, но уже тогда мы могли получать неплохие результаты. Сейчас мы используем ML и AI, которые позволяют достичь более высокой точности.

Для решения каких задач в биологии применяете машинное обучение?

В основном для анализа изображений. На самом деле машинное обучение только начинает применяться в биологии и пройдёт ещё немало времени, пока оно будет на более-менее нормальном уровне использоваться, хотя бы как в области самоуправляемых автомобилей. Пока что алгоритмы ML играют гораздо большую роль для решения промышленных проблем.

Причина в том, что биологический датасет всё же меньше, чем индустриальный. Также тормозят переход к AI количество и ограниченность реагентов, аппаратных часов микроскопов и количество рабочих рук. И, конечно, фрагментированность вопросов. Довольно легко сказать «а давайте различать собачек и котиков на картинках», но довольно сложно решить, стоит ли определять шванновские клетки или детектировать оспу. Кто-то должен принять такое решение.

Вы исследуете скрытое взаимодействие между хозяином (человеком) и патогеном (вирусом) и разрабатываете новые антивирусные стратегии. Что это за стратегии? 

Взаимодействие патогена и хозяина — это суперважный вопрос. Есть много теорий на тему: какую роль вирусы сыграли в эволюции жизни на Земле. Вирусов на планете очень много, но не все из них опасны. Мы изучаем взаимодействие патогенов и хозяев: почему патогены убивают хозяев? Как хозяева пытаются этому противостоять? На самом деле паразитические организмы (вирусы, бактерии) не заинтересованы в том, чтобы убивать хозяина, им выгодно сосуществовать вместе. Источником эпидемии часто является не вирус, а зооноз (инфекционные и паразитарные заболевания, переходящие от животных к человеку). Именно из-за этих паразитов рождаются страшные и опасные эпидемии. Например, так появился вирус Эболы. Это патоген из рода филовирусов, родственный тому, что живёт в приматах.

Мы хотим противостоять заболеваниям, которые вызывают вирусы. Мне в принципе интересен жизненный цикл вируса и как им можно управлять. Вдобавок, есть огромное количество исследований на тему потенциального использования вирусов во благо, например, онколитических вирусов. Также есть исследования, направленные на использование вирусов для борьбы с бактериями, так как всем известные антибиотики теряют эффективность к ряду бактерий.

Результаты ваших исследований уже применяются на практике? 

Наверное, самое близкое к практическому применению из того, что я опубликовал, — это новый вирусный ингибитор оспы. Причём открыл я его совершенно случайно. Да, сегодня оспа не является большой проблемой, потому что вирус уничтожен благодаря успехам ВОЗ. Однако существует животный резервуар вирусов, похожих на оспу, они все генетически близки. Недавно был зарегистрирован случай передачи обезьяньего вируса оспы от человека к человеку в Великобритании (убивает в 10% случаев). Ингибитор, который я открыл, на молекулярном уровне полностью отключает репликацию вируса.

С этим ингибитором был интересный случай. В Англии есть проблема биологического разнообразия, которая заключается в том, что серые северно-американские белки практически полностью вытеснили бурых европейских белок с территории Англии. Небольшая их популяция осталась в Шотландии, где сейчас экологи ведут борьбу за сохранение этого вида. В ходе нашего исследования оказалось, что серые белки являются носителями вируса беличьей оспы, но сами ей не подвержены. При этом они заражают бурых белок, которые потом погибают. И мы решили проверить, сможет ли наш ингибитор вылечить заражённые клетки белок. Оказалось, препарат эффективно ингибирует. Но как скоро мы сможем использовать его повсеместно — сложно сказать. Любые исследования, связанные с применением новых препаратов, занимают около 5-10 лет.

Как вы изучали машинное обучение? Легко ли вам давалась эта область знаний?

Я по образованию химик, который перешёл в биологию, вирусологию и вычислительную биологию. Мой уровень знаний математики позволяет мне довольно легко работать с машинными алгоритмами. Лет восемь назад анализировать изображения было сложнее, чем сейчас. Сегодня, на мой взгляд, машинное обучение доступно большинству людей с техническими склонностями. На определённом уровне обучиться работе с нейронными сетями может любой человек, который не прогуливал математику в вузе. Конечно, я не говорю про разработку алгоритмов, но, если мы имеем в виду обычный запуск нейросетей, то там нет ничего сверхсложного.

Какие языки, технологии используете для обработки биологических данных, их визуализации и математического моделирования?

Давным-давно я начинал с MATLAB, позже ушёл на сторону Python. Без языка программирования R в биологии и вычислительной биологии никуда не уйти. У этого языка огромная история и комьюнити, которое его развивало. Ещё, например, очень интересный язык Julia. Для визуализации часто применяется JavaScript. В ежедневной работе я использую TensorFlow и Keras.

В недавней статье я рассказывал про визуальный пайплайн, где применяется машинное обучение для анализа токсоплазмы в клетках. В этом исследовании мы использовали фреймворк KNIME, потому что хотели сделать визуальную оболочку для того, чтобы биологи могли с лёгкостью, без написания кода, использовать машинное обучение в анализе данных.

Машинное обучение требует большого количества данных. Где их берёте? 

Биологическое комьюнити сильно отличается от комьюнити разработчиков софта, где есть опенсорс. Открытых данных как таковых у нас нет. Элементарно — вы не можете получить доступ к научной статье, если у вас нет подписки на журнал. Это доставляет неудобства всем исследователям. Просто у издательств «классная» бизнес-модель. Они используют труд учёных и бюджетные деньги для того, чтобы создать материал, а в итоге после публикации ты вынужден приобретать подписку.

Мне кажется, это самый лимитирующий фактор для развития машинного обучения в медицинской отрасли — отсутствие достаточного количества данных по конкретной проблеме и доступа к ним. Многие уважающие себя международные исследовательские центры склоняются к созданию открытого доступа к ним. В большинстве случаев данные получают в результате сотрудничества, когда разные группы учённых спонтанно объединяются. Многие из этих групп открыты для сотрудничества. Если люди хотят работать с какими-то конкретными данными, никто не будет этому противостоять или отказывать, если из этого может выйти что-то позитивное.

Как в Швейцарии, где вы раньше жили, и в Великобритании обстоят дела с безопасностью личных данных в медицине?

Какое-то время после защиты диссертации я работал исследователем в университетском госпитале Цюриха. Могу сказать, что там очень серьёзный уровень защиты данных пациента. В Великобритании подход схожий, но в целом страна более открыта к работе с большими данными. Например, есть UK Biobank, с которым сотрудничают многие стартапы. Эта организация даёт доступ к данным, которые у неё есть, для этого нужно быть юридическим лицом, написать обоснование, пройти комиссии. В Швейцарии сделать такое гораздо сложнее.

По теме
Все материалы по теме

Большинство серьёзных организаций, которые накапливают эти данные, стараются соответствовать этическим стандартам. В случае с коммерческими организациями всегда появляются вопросы. Биологическая информация — это сложный и давний вопрос. Есть такие этические моменты, как врачебная тайна, и есть вполне конкретные причины, по которым она существует.

Если, к примеру, вы сделаете полное секвенирование своего генома, и эта информация попадёт в руки злоумышленников, вы уже ничего не сможете изменить.

Вы были бы готовы «поделиться» своим ДНК ради научных целей?

Смотря с кем. С коллегами — с удовольствием. Всё зависит от того, куда пойдёт эта информация, кто с ней работает и для чего. В геноме есть определённая ценность, и к ней нужно относиться трепетно. Не нужно быть совсем уж параноиком, потому что многие интересные вещи можно узнать из банального генетического теста. Но я больше склоняюсь к тому, что, пока  этические проблемы не решены, не стоит создавать условия, в которых ваш генетический код будет полностью открыт. Да, со мной могут не согласиться многие проекты в Скандинавии, которые призывают полностью открыть данные всех пациентов. В этом есть свой плюс, но есть и риски. Представьте этическую дилемму: вы делаете ДНК-тест и узнаёте, что у вас смертельное заболевание. Вы узнали этот факт с определённой долей вероятности. В состоянии ли вы жить с таким бременем? Стоит ли это знать? Каждый должен иметь своё мнение на этот счёт.

Много ли инвестиций поступает в вычислительную биологию? Кто заинтересован в исследованиях в этой нише?

Финансирования в принципе достаточно. Существует много институтов, которые занимаются «не мокрой» биологией (это когда опыт моделируется на компьютере). Например, Институт европейской лаборатории по молекулярной биологии. ЕС выдаёт гранты на подобные исследования. В финансировании области заинтересованы в первую очередь фармацевтические компании, в большинстве есть отделы вычислительных биологов. Нужно понимать, что провести вычислительный эксперимент дешевле, чем «мокрый». Дешевле сделать Монте-Карло симуляцию и предсказать более узкий круг реагентов, которые нужны для того или иного эксперимента. Большинство разумных исследователей движется в этом направлении.

Как бы вы определили уровень «слияния» человека и технологий на сегодня?

Этому тренду уже лет 30. За счёт миниатюризации электроники в таких областях, как кардиохирургия (электрокардиостимуляторы), такое слияние усиливается. Многие процессы, происходящие в организме человека на микроуровне, близки ко многим микроэлектронным процессам. Если взять сигналы нервных клеток (электрохимические сигналы), то не составляет труда интерпретировать их и начать с ними работать.

Интерфейс человека и машины будет двигаться в сторону объединения, отображения результатов воздействия на тело человека микросенсоров. Пока сложно сказать, насколько глобальным это будет в ближайшие годы, потому что не всё можно миниатюризировать. Например, сложные биохимические процедуры нельзя.

Киборги уже на подходе?

Я как исследователь биомедицинской отрасли обязан из этических соображений сказать, что к глубоким интерпретациям косплея научной фантастики нужно относиться скептически. Но частично мы уже являемся киборгами. Интерфейс машины и человека упрощается и движется в эту сторону. Возможно, не в том виде, в котором нам это представляли в фантастических фильмах и книгах. Самый простой и понятный пример слияния человека и технологий — фитнес-трекер. Это классная технология, но у меня, например, есть вопрос, насколько таким сенсорам можно доверять. Если мы говорим о технологиях для развлечения, например, VR, то слияние человека и машины будут развиваться стремительно. Что делать с такими технологиями в реальной медицине, пока не понятно, поэтому там это направление будет развиваться медленнее.

Также всегда будут возникать вопросы вроде «насколько надёжно такое слияние»? Можно ли доверить человеческую жизнь роботизированной руке? Проблема отрасли в том, что нужно чётко понимать цель, для чего те или иные технологии делаются. Если мы говорим про роботизированные конечности, то нужно понять, что это: протезирование или джойстик для управления игрой? И к этим продуктам предъявляются абсолютно разные требования.

Можно ли взять клетку у пациента, перепрограммировать в нужный тип и пересадить ему же?

Да, это уже возможно. Вопрос в том, что вы называете перепрограммированием. Есть классная технология CRISPR для генетической модификации. Недавно в университетском госпитале, где я работаю, было проведено довольно интересное практическое исследование, в котором пациенту пересадили иммунные клетки, перепрограммированые таким образом, чтобы уничтожать раковые клетки. И всё сработало. Но для того, чтобы это попало в реальную медицину, понадобятся многолетние исследования. Когда речь идёт о человеческих жизнях, спешить нельзя. Этот опыт оказался удачным, но так не всегда, например, вирусная терапия рака была временно выключена неудачным опытом. Ещё в 90-х в США пациента, больного раком, пытались вылечить вирусом, который был перепрограммирован на то, чтобы поражать раковые клетки. К сожалению, пациент умер, и это уничтожило огромное количество исследований и остановило область на десятилетия.

Что вы думаете о разработке технологий для омоложения?
По теме
Все материалы по теме

Это новая, перспективная с точки зрения финансирования область, которой увлечены многие сооснователи технологических компаний. Она получила большой прорыв в последние годы, потому что поменялась парадигма исследований, появилась хорошая база для молекулярной биологии.

Биология старения — сложная отрасль. Представьте себе эксперимент, где вы пытаетесь изучить, как некий фактор будет влиять на старение. Чтобы его провести, вам нужно прожить дольше, чем объект вашего исследования. Довольно проблематично изучать старение на сложных организмах, потому что вам просто не хватит времени. Поэтому работы, как правило, проводятся на более простых организмах вроде червей. Я сейчас общаюсь с биологом, который занимается проблемой старения, и мы изучаем данные его червей. Возможно, скоро смогу сообщить, что нам сказали черви.

Одним из важных прорывов последнего времени является открытие сенесцентных клеток, которые накапливают воспаления. Огромное количество работ проделано в области молекулярных сигналов. Думаю, в ближайшие 10-20 лет мы получим молекулы, которые можно будет использовать в качестве ингибитора биологического процесса.  

То есть уже скоро при определённом уровне достатка можно будет купить вечную жизнь? 

Некоторые препараты окажутся дешевле, чем вам кажется. Я не призываю принимать какие-либо препараты без назначения врача, но есть неплохие исследования, которые говорят о том, что долговременное применение определённых доз противовоспалительных препаратов вроде «Ибупрофена» продлевают жизнь мышей.

Насколько богатыми нужно быть, чтобы жить дольше? Я не думаю, что это будет связано с достатком человека. Гораздо важнее огромное количество других факторов. Пилюли для вечной жизни, скорее всего, не будет. Вопрос в том, что вы понимаете под жизнью. В медицинской отрасли есть такое понятие, как качество жизни. И большинство исследований признано улучшить этот показатель вместо того, чтобы увеличивать продолжительность в годах.

Недавно в США закрыли лабораторию, которая 30 лет «тренировалась на кошках» — изучала токсоплазмоз. Что вы думаете об экспериментах с паразитами, которые «управляют сознанием» носителя? 

Философская дискуссия о роли паразитов в эволюции хозяев довольно интересна. Наши недавние исследования с вирусами оспы в Лондоне показывают, что благодаря использованию сигнальных молекул оспа может заставлять заражённые клетки двигаться в определенном направлении. Получаются своеобразные клетки-зомби.

Сама теория, что такие паразиты, как токсоплазма, могут влиять на наше состояние в хорошем смысле, звучит многообещающе. Но у нас нет достоверных данных, насколько она правдива. Даже если иногда сложно сказать, к какому результату приведёт то или иное исследование, это не значит, что оно бесполезно. Например, сейчас все восхищаются технологией CRISPR, но это исследование родилось из очень нишевой области биологии, которая занимается иммунной системой бактерий. Т.е. изначально никто не предполагал, что это будет одним из лучших методов модифицирования генома.

Оцените степень проникновения алгоритмов ML в сегодняшнюю медицину.

Я бы сказал, оно пока на заре. Мы, энтузиасты машинного обучения в этой отрасли, пытаемся показать, что с помощью автоматизации можно выйти на новые объёмы и новые параметры точности. Но мы пока не настолько всех убедили, чтобы отказ от машинного обучения сильно сказался на работе и исследованиях. Думаю, всё зависит от ближайших нескольких лет. Скорее всего, в будущем многое медицинское оборудование будет включать в себя алгоритмы ML.

Зависимость человека от решений искусственного интеллекта в медицине будет быстро возрастать? 

Я к искусственному интеллекту отношусь прагматически — смотрю на него, как на интересный вычислительный метод. Для меня AI является суперклассным методом анализа, который может давать результат с беспрецедентной точностью. Да, есть проблемы, которые связаны со сложностью интерпретации некоторых алгоритмов, но учёные уже занимаются решением этих проблем.

Конечно, мы зависим от алгоритмов, слепо верим им уже сегодня. И чем больше мы будем переходить к информационному обществу, тем больше будем от него зависеть. Но это, пожалуй, единственный способ двигаться дальше. Тут ещё нужно поставить вопрос, что является сильной зависимостью. Мне кажется, если мы знаем, почему искусственный интеллект принимает те или иные решения, значит, всё пока ещё нормально.

Обсуждение