Как разобраться с Computer Vision

Технологии компьютерного зрения помогают робомобилю отличить фонарный столб от оленя, а роботу-курьеру — не перепутать газон с тротуаром. Еще они позволяют распознать человека в толпе, модерировать контент в соцсетях, диагностировать болезнь по рентгеновскому снимку, отличить кота от собаки, а корги — от лабрадора. Специалистов по Computer Vision пока не так много, а спрос на них растет с каждым годом. Рассказываем, как изучить новую технологию, не выходя из дома.         

Оставить комментарий
Как разобраться с Computer Vision

Технологии компьютерного зрения помогают робомобилю отличить фонарный столб от оленя, а роботу-курьеру — не перепутать газон с тротуаром. Еще они позволяют распознать человека в толпе, модерировать контент в соцсетях, диагностировать болезнь по рентгеновскому снимку, отличить кота от собаки, а корги — от лабрадора. Специалистов по Computer Vision пока не так много, а спрос на них растет с каждым годом. Рассказываем, как изучить новую технологию, не выходя из дома.         

Компьютерное зрение (Computer Vision, CV) — это область искусственного интеллекта, связанная с анализом, классификацией и распознаванием изображений и видео. В основе CV-систем обычно лежат алгоритмы на базе машинного обучения — с их помощью они учатся отличать одни объекты от других, видеть паттерны и закономерности. Человек учится распознавать образы в процессе знакомства с окружающим миром — еще в детстве он запоминает, чем отличается кошка от собаки, а интерфейс Among Us — от интерфейса Minecraft. Компьютер «мыслит» иначе — чтобы научить систему распознавать образы, ей нужно «скормить» датасет с размеченными данными, который наглядно показывает отличия одного объекта от другого.

Разметка данных, кстати, целая наука — причем довольно трудоемкая. Обычно для этого нанимают фрилансеров, которые дистанционно маркируют видеоролики и изображения. Чем точнее разметка и чем больше данных, тем точнее будет работать система компьютерного зрения. При этом многое зависит от специфики — алгоритм, которые ориентируется в разных видах птиц, не поможет робомобилю распознать преграду на дороге. Хотя бывают интересные прецеденты. Например, в Японии алгоритм для распознавания выпечки стали использовать для диагностики рака. 

Реконструкция работы системы распознавания объектов у автомобилей Tesla.

С каждым годом технология эволюционирует, но без глитчей пока не обходится: алгоритмы путают людей с животными, принимают абстрактные паттерны за реальные объекты, а иногда не могут отличить черепаху от ружья. Задача специалистов по компьютерному зрению — свести к минимуму такие инциденты и научить алгоритмы уверенно ориентироваться в окружающем мире. Например, на производстве система сможет выявить бракованное изделие, в клинике поможет врачу отличить злокачественную опухоль от доброкачественной, а астрофизикам позволит быстрее классифицировать небесные тела.

Технология сама по себе нейтральна, но применять ее можно по-разному — например, некоторые государства используют ее для деанонимизации протестующих. Поэтому специалистам по ИИ рекомендуют изучать этику в сфере машинного обучения. Один из таких курсов мы специально включили в эту подборку.

Где изучать компьютерное зрение?

Бесплатные уроки по теме «Компьютерное зрение» от Udemy 

Восемь коротких уроков отлично подойдут для быстрого погружения в тему. Например, вы узнаете, как устроена навигация робомобилей, что такое метод Виолы — Джонса, как работают сверточные и генеративно-состязательные нейросети, а также познакомитесь с библиотекой OpenCV и поймете, как использовать ее для распознавания лиц.

Подробнее

Глубокое обучение и компьютерное зрение от А до Я: OpenCV, SSD и GAN от Udemy

На курсе вы освоите базовые инструменты компьютерного зрения и сможете не только создать приложение для распознавания лиц и объектов, но также генерировать изображения с помощью GAN — генеративно-состязательных нейросетей.

Подробнее

Компьютерное зрение с OpenCV и Python от Udemy

Вы узнаете, как глубокое обучение помогает компьютерам распознавать образы, а также создадите сервисы для распознавания и отслеживания объектов. Для обучения пригодится знание Python, но самых базовых навыков будет достаточно. Кстати, приобретать дорогое ПО не придется — в процессе обучения вы будете использовать бесплатные инструменты с открытым кодом.

Подробнее

Нейронные сети и компьютерное зрение от Stepik

Курс составили эксперты Samsung AI Center, которые на практике применяют технологии компьютерного зрения. На программе вы построите свою первую нейронную сеть, а также изучите архитектуру и алгоритмы ее настройки. Авторы утверждают, что курс подойдет даже старшеклассникам, но если у вас нет опыта работы с системами машинного обучения, то на освоение материалов лучше заложить побольше времени.

Подробнее

Компьютерное зрение от Coursera

Курс от Московского физико-технического института разбирает прикладные задачи из различных областей дата-аналитики, включая анализ текста, информационный поиск, коллаборативную фильтрацию и рекомендательные системы, бизнес-аналитику и прогнозирование временных рядов. Большинство преподавателей — это бывшие или действующие сотрудники Яндекса.

Подробнее

Основы компьютерного зрения с Watson и OpenCV от edХ

На этом вводном курсе вы научитесь обрабатывать и классифицировать изображения, следуя гайдлайнам от сотрудников IBM, а также освоите базовые принципы работы с Python, Watson AI и OpenCV

Подробнее

Обработка изображений с помощью Python. Бесплатный курс от DataCamp

Отличное дополнение к курсу от edX — четыре модуля по обработке и маркировке изображений. Программа сфокусирована не столько на компьютерном зрении, сколько на обработке визуала (image processing). Например, вы научитесь улучшать качество медицинских снимков, увеличивать фотографии в несколько раз, удалять отдельные объекты и распознавать паттерны с помощью современных инструментов на базе машинного обучения.

Подробнее

Станьте экспертом по компьютерному зрению с Udacity

На занятиях вы научитесь работать с системами компьютерного зрения, которые уже применяются во многих отраслях — от производства до автотранспорта. Партнерами курса выступили Nvidia, Deep Learning Institute и компания Affectiva, которая создает ПО для распознавания эмоций по фото и видео. Плюс обучения на Udacity — это дополнительная помощь с трудоустройством после окончания курса. Вам помогут улучшить резюме и страницу на LinkedIn, а также организуют ревью кода на Github.

Подробнее

Специализация «Глубокое обучение» от Coursera

Фундаментальная программа, разработанная при участии известного эксперта по машинному обучению Эндрю Ына, включает пять курсов по глубокому обучению. Вы узнаете, какие технологии на самом деле скрываются за абстрактным понятием «искусственный интеллект», научитесь работать с разными типами нейросетей и сможете применять их для распознавания образов, синтеза речи и музыки. 

Подробнее

Специализация Ethics in the Age of AI от Coursera

Разработчики часто закладывают в алгоритмы собственные предубеждения и когнитивные искажения. В результате ИИ дискриминирует отдельные группы людей, совершает ошибки и вводит в заблуждение пользователей. Курс объясняет, что скрывает за «черный ящик» искусственного интеллекта и как предрассудки становятся частью «прошивки», а главное, объясняет разработчикам, как этого избежать.

Подробнее

В дополнение к курсам мы собрали пять книг по теме, которые уже переведены на русский язык

«Глубокое обучение. Погружение в мир нейронных сетей» С. И. Николенко, А. Кадурин, Е. В. Архангельская (2018)

Книга раскрывает историю глубокого обучения, его основные компоненты, а также современные достижения в этой области. Много объяснений, минимум кода и максимум пользы.

Читать

«Программирование компьютерного зрения на языке Python» Я. Э. Солем (2018)

В пособии подробно изложены основы теории и алгоритмов компьютерного зрения. Вы познакомитесь с различными методами распознавания объектов, трехмерной реконструкции, обработки стереоизображений, дополненной реальности и других сценариях применения компьютерного зрения. Книга предлагает упражнения, которые помогут проверить знания на практике. Недостаток — «хардкорный» стиль повествования. Как отмечает один из читателей: «Если у вас средний балл по высшей математике был менее 4,99, то понять что-либо в книге будет затруднительно».

Читать

«Обработка изображений с помощью OpenCV» Глория Буэно Гарсия (2016)

OpenCV — это широко распространенная библиотека компьютерного зрения. Она включает сотни готовых функций обработки изображений и используется как в сфере образования, так и в промышленности. Пособие дает базовое представление о библиотеке и сценариях ее применения. В книге подробно разобраны методы обработки изображений, например, ретуширование, очистка от шумов и создание HDR-изображений. Неплохой вариант для знакомства с OpenCV для новичка.

Читать

«Код креативности. Как искусственный интеллект учится писать, рисовать и думать» Маркус дю Сотой (2020)

azbooka.ru

Оксфордский профессор и популяризатор науки Маркус дю Сотой пытается понять, подвластно ли алгоритмам творчество. Можно ли с помощью ИИ генерировать произведения искусства и какой эмоциональный отклик они вызывают у читателя? Полезное чтение в эпоху, когда созданные нейросетями картины уже продаются на крупных аукционах.

Читать

«IT как оружие. Какие опасности таит в себе развитие высоких технологий» Брэд Смит, Кэрол Браун (2021)

telemetr.me

Краткий ликбез по проблемам этики в сфере высоких технологий от руководителей компании Microsoft. Авторы разбираются в вопросах приватности, кибербезопасности и автоматизации. Как отмечает одна из читательниц: «Отзыв на эту книгу можно начать с признания, что у меня прямо сейчас заклеена вебка на ноутбуке. Пока слушала [аудиокнигу], желания отклеить [стикер] не появилось».

Читать

Хотите сообщить важную новость? Пишите в Телеграм-бот.

А также подписывайтесь на наш Телеграм-канал.

Читайте также

Акции AMC – очередная игрушка форумчан с Reddit
Акции AMC – очередная игрушка форумчан с Reddit
Акции AMC – очередная игрушка форумчан с Reddit
Популярное Reddit-сообщество Wall Street Bets продолжает нести возмездие на финансовых рынках. Движение выступает против хедж-фондов и институциональных инвесторов, которые распродают акции публичных компаний и тем самым подталкивают их к банкротству. Ранее сообщество обрушилось на фонд Melvin Capital, чтобы поддержать сеть магазинов GameStop. А затем Wall Street Bets взялась за новое дело — спасение сети кинотеатров AMC Entertainment. Разбираемся, как форум-активисты подняли стоимость акций в 6 раз и стоит ли следовать их примеру.
23 классных ютуб-канала про AI, машинное обучение и Data Science
23 классных ютуб-канала про AI, машинное обучение и Data Science
23 классных ютуб-канала про AI, машинное обучение и Data Science
Профессии аналитика данных и дата-сайентистов, специалистов по AI, машинному обучению и цифровой трансформации уже не один год делают престижные списки самых перспективных профессий LinkedIn, Всемирного экономического форума, Glassdoor и не только, а их роль в жизни общества неизменно растёт. Ниже — подборка 23 влогов и каналов на YouTube, которые бесплатно знакомят зрителей с искусственным интеллектом, машинным обучением и data science.
Курс Digital MBA со скидкой 20% + день открытых дверей MBA Нетологии
Курс Digital MBA со скидкой 20% + день открытых дверей MBA Нетологии
Курс Digital MBA со скидкой 20% + день открытых дверей MBA Нетологии
16 июня состоится День открытых дверей MBA Нетологии, где расскажут, что такое MBA, чем отличается обычное MBA от digital MBA, сколько стоит и длится дистанционное обучение.
20 недооцененных навыков, которые нужны программисту для карьерного роста
20 недооцененных навыков, которые нужны программисту для карьерного роста
20 недооцененных навыков, которые нужны программисту для карьерного роста
Автор книги «От разработчика до руководителя», технический директор и бывший вице-президент Goldman Sachs по технологиям, Камиль Фурнье опубликовала на Medium список недооцененных soft skills, которые нужны всем разработчикам — и джуниорам, и миддлам, и тимлидам — для карьерного роста. Мы отобрали 20 навыков, а также нашли курсы, где можно за короткий срок прокачать нужные скиллы.
4 комментария

Обсуждение

Комментариев пока нет.
Спасибо! 

Получать рассылки dev.by про белорусское ИТ

Что-то пошло не так. Попробуйте позже