Морфологические операции над изображениями — это применение элемента структурирования к исходному изображению для создавая выходного изображения одного размера.
Введение
Понятие морфология является описанием свойств формы и структуры определенных объектов. В области машинного зрения данное понятие следует отнести к описанию свойств формы областей на изображении. Процедуры математической морфологии первоначально определялись в качестве операций над множествами, но затем оказалось, что они также могут быть полезными при обработке множества точек в двумерном пространстве.
Множествами в математической морфологии выступают объекты на изображениях. Необходимо подчеркнуть, что множество всех фоновых пикселей изображения в двоичном коде может считаться одной из версий его полного описания. Прежде всего математическая морфология применяется, для того чтобы извлечь некоторые свойства изображения, полезные для его представления и описания. К примеру, это могут быть контуры изображения, остовы, выпуклые оболочки. Также могут представлять интерес морфологические методики, используемые на этапах предварительной и финальной обработки изображений, таких как, морфологическая фильтрация, увеличение или уменьшение толщины линий.
Морфологические операции над изображениями
В качестве входных данных для аппарата математической морфологии служат следующие изображения:
- Изображение, подлежащее обработке.
- Специальное изображение, которое зависит от типа операции и поставленной задачи.
Данное специальное изображения называется примитивом или структурным компонентом. Обычно структурный компонент имеет гораздо меньшие размеры, чем обрабатываемое изображение. Структурный компонент может считаться описанием области с некоторой формой. Естественно, эта форма может иметь любую конфигурацию, но она должна обладать возможностью ее представления в формате бинарного изображения требуемых размеров.
В различных пакетах обработки изображений самые используемые структурные компоненты обладают следующими специальными названиями:
- $BOX[H,W]$ является прямоугольником определенного размера.
- $DISK[R]$ является диском требуемого размера.
- $RING[R]$ является кольцом заданного размера.
Результат морфологической обработки определяется как размером и конфигурацией исходного изображения, так и структурным примитивом.
Размеры структурного компонента обычно равняются 33, 44 или 5*5 пикселей. Это объясняется основной идеей морфологической обработки, в ходе которой следует отыскать характерные детали изображения. Искомая деталь должна быть описана примитивом, и в итоге морфологической обработки могут быть подчеркнуты или удалены такие детали на всем изображении.
Одним из главных достоинств морфологической обработки является ее простота, то есть, как на входе, так и на выходе операции обработки получается изображение в двоичном коде. Другие методики обычно из начального изображения вначале формируют полутоновое изображение, которое далее преобразуется в бинарное при помощи пороговых функций.
Главными операциями математической морфологии могут считаться следующие:
- Операция наращивания.
- Операция эрозии.
- Операция замыкания.
- Операция размыкания.
Данные названия отражают всю сущность этих операций:
- Операция наращивания способна увеличить область изображения.
- Операция эрозии способна сделать область изображения меньше.
- Операция замыкания предоставляет возможность замыкания внутренних отверстий области и устранения заливов вдоль границы области.
- Операция размыкания способна помочь избавиться от небольших фрагментов, которые выступают наружу области вблизи ее границы.
Объединением двух множеств A и B, обозначаемым как C=A∪B, является по определению множество всех элементов, которые принадлежат или множеству A, или множеству B, или обоим множествам одновременно. Пересечением двух множеств A и B, обозначаемым как C=A∩B, является по определению множество всех элементов, которые принадлежат одновременно обоим множествам A и B. Дополнением множества A является множество элементов, которые не содержатся в A:
Ac={w|w∉A}.
Разностью двух множеств A и B, обозначаемой как A\B, является следующее выражение:
A\B={w│w∈A,w∉B}=A∩Bc.
То есть, данное множество включает в свой состав все элементы множества A, не входящие в множество B.
Рассмотрим использование отдельных операций на конкретных примерах, представленных на рисунке ниже.
Рисунок 1. Морфологические операции над изображением. Автор24 — интернет-биржа студенческих работ
Операция переноса $X_t$ множества пикселей X на вектор t может быть представлена в виде $X_t={x+t|x∈X}$. Это означает, что перенос множества единичных пикселей на двоичном изображении выполняет сдвиг всех пикселей множества на требуемое расстояние. Вектор переноса t может быть представлен как упорядоченная пара:
$ (∆r,∆c)$,
где ∆r является элементом вектора переноса в направлении строк, ∆c является элементом вектора переноса в направлении столбцов изображения.
Рассмотрим еще один конкретный пример. Допустим имеется следующее бинарное изображение и структурный компонент:
Рисунок 2. Бинарное изображение и структурный компонент. Автор24 — интернет-биржа студенческих работ
Структурный компонент S следует применить ко всем пикселям двоичного изображения. Каждый раз, когда начало координат структурного компонента совмещается с единичным бинарным пикселем, ко всему структурному компоненту следует применить перенос и дальнейшее логическое сложение с требуемыми пикселями двоичного изображения. Итоги логического сложения должны быть записаны в выходное двоичное изображение, которое изначально было инициализировано при помощи нулевых значений.
При осуществлении операции эрозии структурный компонент также проходит по всем пикселям изображения. Если в определенной позиции каждый единичный пиксель структурного компонента имеет совпадение с единичным пикселем двоичного изображения, тогда следует выполнить логическое сложение центрального пикселя структурного компонента с необходимым пикселем выходного изображения.