КОРПБЛОГИ · 25 ноября 2017, 11:30 · Катерина Шкор
С чего начать: подборка курсов по компьютерному зрению

Предположим, у вас есть идея научить бездушный ноутбук узнавать вашего кота. Или наводить смартфон на игроков чемпионата по баскетболу, чтобы приложение подсказывало вам их имена, годы рождения, процент попаданий и годовую зарплату. Всё это — это поводы углубиться в изучение машинного зрения.

Иллюстрация: iamWire

Краткий ликбез

Компьютерное (машинное) зрение — это набор технологий, методов и алгоритмов, целью которых является «научить бездушный компьютер обозревать окружающую действительность с некоторой долей оразумения».

Сегодня процесс машинного зрения реализуется через «фильтрацию» изображений на необходимый ряд признаков и обработку результатов этой фильтрации. Поэтому, прежде чем начинать разговор об излюбленных нейросетях и машинном обучении, важно понять, что основа компьютерного зрения — это именно обработка изображений. Таким образом, единственный способ позволить компьютеру «увидеть» нашу реальность — дать ему ряд нужных признаков и попросить найти их на изображении.

К примеру, есть задача научить ваш MacBook узнавать кота в видеочате в скайпе. Для начала нужно «рассказать» машине об основных признаках кота. Затем — показывать фото котов: белых, серых, маленьких, больших, размытых, четких, в светлой комнате, темной. Чем больше разных котов увидит машина, тем лучше она адаптируется и с большей вероятностью начнёт узнавать кота в разных условиях. Такая методика называется глубинным обучением, оно же и является основной сложностью сегодня, потому что исследователь всегда остаётся ограничен базой изображений.

Затем можно отправиться в полевые условия и начать видеочат с котом. Компьютер захватывает сцену реального мира из видеопотока, сканирует её на наличие признаков кота, и, найдя их, сигнализирует об этом.

Исследователи пытаются найти совершенно иные подходы к компьютерному зрению, однако анализ изображения и машинное обучение — пока единственный способ «увидеть» нас для компьютера. 

С чего начать обучение?

ВАРИАНТ 1: Онлайн-курсы. Платные и бесплатные

  1.  Introduction to Computer Vision, Udacity (бесплатно).
    Четырёхмесячный курс о классической теории компьютерного зрения. Визуальная система человека и работа с изображением: обработка, освещение, движение, классификация и распознавание;
  2. Computer Vision, Center For Research in Computer Vision (бесплатно).
    Курс из 20 лекций по 45-90 минут. Академично и глубоко рассматриваются фундаментальные матрицы изображений, оптический поток, масштабно-инвариантное преобразование признаков, различные алгоритмы и методы работы с изображением;
  3. Введение в компьютерное зрение, Лекториум (бесплатно).
    В курсе рассматривают как базовые понятия компьютерного зрения, так и ряд современных алгоритмов, позволяющих решать практические задачи. Отдельно отмечают связь методов компьютерного зрения с обработкой зрительной информации в мозгу человека;
  4. Deep Learning in Computer Vision, Coursera (бесплатно).
    Этот пятый курс из семи в специализации «Машинное обучение». Речь пойдет о распознавании изображений и видео, включая классификацию, поиск изображений, методы обнаружения объектов, отслеживание объектов в видео, распознавание человеческих действий и, наконец, редактирование и создание новых изображений;
  5. Computer Vision Courses, Udemy (платно, от 10$).
    Ряд платных курсов, среди которых можно найти и изучить основы машинного обучения, наиболее известнын готовые библиотеки и технологии для работы с CV.

Часть онлайн-курсов посвящена работе с OpenCV — одной из популярных библиотек с открытым кодом, которая предоставляет набор типов данных и алгоритмов для обработки изображений:

Иллюстрация: xerox

ВАРИАНТ 2: Читать книги

Хотя компьютерное зрение — область, которую невозможно объять без реального программирования, подковаться теоретически тоже будет полезно. Для этого стоит обратить внимание на следущие издания:

  1. Richard Szeliski, Computer Vision: Algorithms and Applications;
  2. Simon J. D. Prince, Computer Vision: Models, Learning, and Inference;
  3. Hairong Qi, Wesley E. Snyder Fundamentals of Computer Vision.

ВАРИАНТ 3: Работа

Можно старым «дедовским способом» найти работу с подходящим проектом, и узнавать, учиться и экспериментировать непосредственно в процессе.

Будущее компьютерного зрения

Исследователи прогнозируют использование компьютерного зрения в будущем практически во всех областях жизни человека: робототехника, биометрика, медицина, индустрия развлечений. По прогнозам Microsoft, к 2027 году появятся решения, способные не просто записывать изображение окружающего мира, а действительно «видеть» его, помогать в работе и в повседневной жизни людям самых разных сфер деятельности.

Источник: dev.by
Нашли в тексте ошибку — выделите её и нажмите Ctrl+Enter.
Вакансии
Новые комментарии
Вот смотрите, многие вещи как бы на поверхности. Любой адекватный опытный ИТ-шник вам скажет, что все эти ассоциации ИИ, федерации и прочие профанации, всё это шелуха никому не нужная, и нужная если только для ЧСВ их председателей и членов советов. Сейчас самая насущная необходимость при строительстве ИТ-страны это кадры. И это не только и не столько кадры для ПВТ. Эта не та проблема, которая сейчас закрывается кадрами из россии, украины и даже возвращенцами из США, как здесь. Есть более глобальная проблема с кадрами. Если мы меняем экономику, строим ИТ-страну, то это проблема с ИТ-кадрами для всей экономики: начиная от крупного ИТ-менеджмента ИТ-директоров до последней тестировщицы и сисадмина. И не только их. Сейчас каждый второй специалист должен быть отчасти ИТ-шником. Если мы берем МАЗ или БелАЗ, то в ИТ-стране это уже не будут предприятия в их нынешнем понимании. Они должны стать ИТ-компаниями, как у Маска. Вон точно так же, как идея Грефа - Сбербанк это ИТ-компания с банковской лицензией. Поэтому на МАЗе в ИТ-стране должно работать не 0,5% или 0,05% ИТ-шников, как сейчас (не знаю точно, да это не важно, главное - суть), а 50%, а может и больше. Пусть это не будут все 50% программистов и тестировщиков. Но в любом случае это будут 50% ИТ-шников - людей разбирающихся в ИТ, в современной цифровой экономике и цифровом бизнесе. Вот тогда это будет предприятие ИТ-страны. Тогда хотя бы теоретически появится возможность конкурировать с мировыми компаниями. Пусть даже с тем же Маском. А теперь давайте прикинем, какое количество ИТ-шников в таком случае необходимо в разрезе всей страны? Поэтому толковые уважаемые люди вроде Лознера (или неуважаемый я уже десятый год) и говорят про современный ИТ-университет национального масштаба. Пусть он будет называться как угодно - "ИТ-академия", "ИТ-кластер", пусть он будет построен с нуля или на базе БГУИР, образовательного центра ПВТ или Белхарда или ещё какого-нибудь - это всё уже вторичные вопросы... Пока речь про стратегию и концепцию... Но этот ИТ-университет нужен и должен создаваться с конкретной целью - кадры для ИТ-страны. Не для ПВТ, как сейчас, куда идут лучшие кадры, но который работает на себя, для себя, а не в интересах развития предприятий остальной экономики. И не так как сейчас для остальной экономики - куда идут лузеры не попавшие в ПВТ, которые растворяются в этих 0,05% описанных выше и ничего не могут изменить на предприятиях и делают тоже самое, что и остальные - тупо плывут по течению госрегулирования. Поэтому только когда все предприятия станут одним большим ПВТ - это и будет ИТ-страна. Так казалось бы, что мешает взять не эту девочку, которая при всём к ней уважении, но я не понимаю, какое вообще отношение может иметь к ИТ-стране, а нанять какого-нибудь Богуша или Цепкало. Неужели если взять все их навыки и знания в области управления глобальными процессами такого масштаба (на уровне целого государства), знания в управлении образовательным процессом, те связи, которые есть у этих людей (сравните это всё – с девочкой-пекарем, ещё раз никого не хочу обидеть, просто по фактам и реальному положению вещей) и к этом всему добавить ИТ-экспертизу Мамоненко и его людей, его связи с белорусским ИТ-сообществом и бизнесом – неужели такой союз не смог бы поднять подобный проект? Или хотя бы начать этот проект. Что б остальное ИТ-сообщество + государство подхватило. Проект ИТ-университета, проект, который был бы вкладом в ИТ-страну намного большим, чем любая очередная ассоциация – как бы она там не называлась “искусственного интеллекта”, “блокчейна” и чего там ещё. Почему же они не делают это? Отчасти ответ уже прозвучал выше. Эти все топы и владельцы ИТ-компаний получается, если так по-честному брать - вруны и лицемеры. На самом деле им не нужна ИТ-страна. Какие бы они красивые статьи не писали и интервью не давали. Потому что сами принципы построения ИТ-страны идут в разрез с их интересами. Ведь если будет создан такой университет, сразу встанет вопрос, куда отправлять лучших выпускников? Куда отправлять лучшие кадры? Ведь речь не только про молодежь. А выпускников и квалифицированные кадры надо отправлять в реальный сектор экономики: на МАЗы и БелАЗы и прочие предприятия. В школы, больницы, университеты, органы власти, армию и милицию – всюду отправлять. Что бы во всех сферах создавать ИТ-страну. Так какой владелец ИТ-компании согласиться тратить свои ресурсы на создание такого университета, если потом выпускники должны будут идти не к нему? Нет, на самом дели эти вышеназванные топы и владельцы ИТ-компаний блюдут исключительно свои меркантильные интересы. И им нужен моментальный, краткосрочный эффект. Поэтому занимаются мелким пиаром. Много говорят высоких красивых слов. Но делают гораздо меньшие шаги. Вроде найма не совсем понятной девушки не особо понятно для чего, но не забывая при этом добавить какие то высокопарные слова про “ИТ-страну”.
mihail_che
20.07.2018 в 12:41
Belarusian Dream. Белоруска училась за деньги Госдепа, работала в Нью-Йорке, пекла хлеб в Аризоне, получила американский паспорт — и вернулась строить ИТ-страну


Авторизуйтесь, чтобы оставлять комментарии

Использование материалов, размещенных на сайте, разрешается при условии прямой гиперссылки на dev.by. Ссылка должна быть размещена в подзаголовке или в первом абзаце публикации.
datahata — хостинг в Беларуси