Обработка изображений в системах искусственного интеллекта (курс лекций, И.А.Матвеев)

Материал из MachineLearning.

Перейти к: навигация, поиск

Содержание

В курсе рассматриваются теоретические основы обработки и анализа изображения, основные подходы и модели для описания объектов на изображениях в системах компьютерного зрения и искусственного интеллекта.

Компьютерное зрение относится к области создания искусственных интеллектуальных систем, которые получают информацию из изображений и на ее основе формируют знания и делают заключения. Изображения регистрируются с помощью видео датчиков (видеокамер) в различных частотных диапазонах, и могут быть представлены с помощью двумерных матриц яркости, откликов двумерного сенсора.

Автоматический анализ, распознавание объектов на изображениях и видео, восстановление структуры 3D сцены являются основными задачами компьютерного зрения. Как правило, они разбиваются на несколько подзадач: предобработка, выделение характерных свойств изображения объекта, классификация и заключение (принятие решения). Этап предобработки обычно включает такие операции с изображением, как фильтрация, выравнивание яркости, геометрические корректирующие преобразования для облегчения устойчивого выделения характерных свойств объекта, которые представляются как некоторое множество признаков, приближённо описывающее интересующий объект, его поведение. Классификация строится путем анализа полученного множества признаков, разделения признакового пространства на подобласти, указывающие на соответствующий класс. Принадлежность к некоторому классу зарегистрированного объекта или структуры на изображении используется в последующих этапах принятия решения в интеллектуальной системе.

Предлагаемый курс концентрируется на изложении основных математических моделей и алгоритмов предобработки, выделения характерных свойств изображения объектов с целью дальнейшей классификации и анализа.

От студентов требуются знания курсов линейной алгебры, математического анализа, теории вероятностей.


Курс читается студентам 4 курса кафедры «Интеллектуальные системы / проектирование и организация систем» ФУПМ МФТИ. Программа лекционного курса рассчитана на 32 часа (семестр), предусмотрены практические (семинарские) занятия (16 часов) и лабораторные работы (16 часов).

Замечания для студентов


Программа курса

Задачи обработки изображений в системах искусственного интеллекта

  • Путь сигнала при обработке: регистрация сенсором – выделение признаков – классификация – представление в системе – построение заключения (выработка управляющего сигнала).
  • Глаз и сетчатка – естественные устройство и сенсор получения изображений. Первичная обработка изображения в сетчатке и зрительной коре головного мозга.
  • Искусственные устройства получения изображений. Модели изображений.

Операции над изображениями

  • Классификация различных видов операций над изображениями
  • Точечные методы обработки изображений
  • Гистограмма, операции с гистограммой: нормализация, эквализация, гамма-коррекция и т.п.
  • Алгебраические и геометрические преобразования изображения

Пространственно-локальные методы обработки изображений (фильтры)

  • Пространственная частота изображения. Свертка изображения.
  • Построение фильтров. Низкочастотные, полосные и высокочастотные фильтры.
  • Выделение края. Фильтры направленного градиента, Лапласа, Собеля.

Математическая морфология

  • Нелинейные фильтры, фильтры порядковых статистик, релаксации.
  • Частные случаи фильтров порядковых статистик: эрозия, дилатация, медиана.
  • Морфологические операции на дискретных изображениях, частный случай бинарного изображения

Спектральный анализ изображений

  • Дискретное преобразование Фурье.
  • Преобразования Адамара, Уолша, Хаара.
  • Быстрые методы расчёта спектральных преобразований.

Вейвлет-анализ

  • Базис функций Габора
  • Дискретное вейвлет-преобразование
  • Анализ мод вейвлет-преобразования
  • Вейвлет-анализ как метод выделения пространственной и частотной структуры данных

Выделение признаков и сегментация

  • Текстура и методы её анализа
  • Понятие связности. Метод «лесного пожара».
  • Сегментация методами водораздела и квадрирования.
  • Диаграммы Вороного

Представление и описание областей изображения

  • Цепные коды, стягивающие ломаные.
  • Методы слияния и разбиения при построении границ.
  • Сигнатуры (одномерные функции описания границ).
  • Остовы областей. Преобразование к главным осям, методы утоньшения.

Поиск объектов заданной формы

  • Алгебраический и морфологический корреляторы.
  • Обобщённое преобразование Хафа, аналогия со свёрткой
  • Преобразования Хафа для прямых и окружностей

Оптические потоки

  • Алгоритмы Лукаса-Канаде, Хорна-Шунка.

Проективная геометрия и восстановление трёхмерной структуры

  • Однородные координаты, эпиполярная геометрия, фундаментальная матрица.
  • Восстановление формы из движения, из стерео, из затенения, из расфокусировки.


Семинары

Построение фильтров

  • Низкочастотные, полосные и высокочастотные фильтры.
  • Фильтры направленного градиента, Лапласа, Собеля.
  • Фильтр Кэнни.

Фильтры порядковых статистик, релаксации

  • Частные случаи фильтров порядковых статистик: эрозия, дилатация, медиана.
  • Морфологические операции на дискретных изображениях, частный случай бинарного изображения.

Текстура и методы её анализа

  • Понятие связности.
  • Метод «лесного пожара».
  • Сегментация методами водораздела и квадрирования.

Описание областей изображения

  • Цепные коды, стягивающие ломаные.
  • Методы слияния и разбиения при построении границ.
  • Сигнатуры (одномерные функции описания границ).

Оптические потоки

  • Алгоритмы Лукаса-Канаде, Хорна-Шунка.

Проективная геометрия

  • Однородные координаты, эпиполярная геометрия, фундаментальная матрица.
  • Восстановление формы из движения, из стерео, из затенения, из расфокусировки.


Лабораторные работы

Темы работ

  1. Изучение растрового представления изображения и методов работы с ним. Применение фильтров первичной обработки изображения для выделения признаков различного рода.
  2. Написание собственного кода, реализующего некоторые простые операции над изображением (построение пирамиды, линейные фильтры с заданным ядром и т.п.)
  3. Изучение морфологических операторов над изображением. Морфологическое выделение границ, выделение объектов оператором «попадание-промах».
  4. Изучение различных методов описания признаков изображения. Сравнение вычислительной сложности и информационной ёмкости описаний.

Необходимое программное обеспечение

  • среда разработки и компилятор языка C/C++
  • библиотека OpenCV
  • среда разработки Python


Литература

Основная литература

  1. Гонсалес Р., Вудс Р. Цифровая обработка изображений. М., Техносфера, 2005 – 1072 с.
  2. Методы компьютерной обработки изображений. Под ред. В.А.Сойфера. М., Физматлит, 2003. – 780 с.
  3. Шапиро Л, Стокман Дж. Компьютерное зрение. М., БИНОМ. Лаборатория знаний, 2006 – 752 с.
  4. Форсайт Д, Понс Ж. Компьютерное зрение. Современный подход. М., Издательский дом «Вильямс», 2004 – 928 с.
  5. Яне Б. Цифровая обработка изображений М.: Техносфера, 2007 – 584 с.
  6. Duda R.O., Hart P.E., Stork D.G Pattern classification. New York, Wiley Interscience Publication, 2001 – 654 p.

Дополнительная литература

  1. Ту Дж., Гонсалес Р. Принципы распознавания образов. М., Мир, 1978 – 412 с.
  2. Фукунага К. Введение в статистическую теорию распознавания образов. М., Наука, 1979 – 368 с.
  3. Харман Г. Современный факторный анализ. М., Статистика, 1972 – 486 с.
  4. Шеффе Г. Дисперсионный анализ. М., Наука. 1980 – 512 с.
  5. Факторный дискриминантный и кластерный анализ. Под ред. И.С. Енюкова. М., Финансы и статистика, 1989 – 215 с.
  6. Гренандер У. Лекции по теории образов м.: Мир, 1981 – 448 с.


Программу составил
И.А. Матвеев, д.т.н.

См. также

Список подстраниц

Обработка изображений в системах искусственного интеллекта (курс лекций, И.А.Матвеев)/Вопросы
Личные инструменты