Общее описание методов компьютерной обработки изображений

Математически в общем виде задачу распознавания можно сформулировать следующим образом: «пусть дано множество М объектов; на этом множестве существует разбиение на конечное число подмножеств (классов) Q, і = {l,m},M = Qi (і = l..m) . Объекты w задаются значениями некоторых признаков Xj, j= {1 ,N] . При этом описание объекта I(co)=(xi(co), ..., xn(

ет значение из множества допустимых значений. Необходимо выделить требуемые подмножества на основании необходимых признаков.»

При цифровой обработке изображения обычно используется его представление в памяти в виде цифровой модели, представленной матрицей вида:

Иц

F12

F13 -

Fii ...

Fm

F21

F22

F23

F2i ...

F2n

1 =

Fii

Fi2

F:3

Fjn

(1)

Fml

Fm2

Fm3 -

F 1 mi

F

1 mn

где Fi.j - код, характеризующий тон, насыщенность и яркость і-го пиксела j-й строки растра; l

Обработка изображения в общем случае заключается в выполнении какого-либо преобразования указанной матрицы, в результате которого формируется набор ее числовых характеристик или новое, обработанное изображение. Преобразование может касаться значений элементов или их координат (индексов), выполняться над матрицей в целом, группой элементов или над каждым элементом в отдельности.

Двумерный цифровой фильтр работает следующим образом. Выбирается небольшой (обычно прямоугольный) участок поверхности изображения и на нем определяется некоторая функция. Этот участок называется апертурой или окном, а заданная на нем функция - весовой функцией или функцией окна. В общем случае под весовой функцией двухмерного фильтра понимается его реакция на входной сигнал, описываемый дельта-функцией.

Таким образом, каждому элементу апертуры соответствует (присваивается пользователем) определенное кодовое число, которое также называется весовым множителем. Совокупность всех весовых множителей и составляет весовую функцию. Апертуру вместе с заданной на ней весовой функцией часто называют маской.

Апертура обычно имеет небольшой размер, например 3x3 или 5x5 дискретных элементов изображения. Линейные размеры апертуры берутся нечетными, чтобы можно было однозначно указать её центральный элемент. Необходимо отметить, что в данной работе применяется так же и одномерная апертура, размер которой равен одному пикселу.

Фильтрация осуществляется перемещением апертуры фильтра по изображению. В каждом дискретном положении аппретуры выполняются однотипные действия, которые и определяют отклик фильтра. Весовая функция в процессе перемещения окна остаётся неизменной, что позволяет отнести фильтрацию скользящим окном к пространственно-инвариантным операциям.

В зависимости от операций в работе применяются как линейные так и нелинейные фильтры.

В линейных фильтрах отклик является линейной функцией многих переменных, роль которых играют попавшие в окно пикселы. Весовыми множителями являются коэффициенты линейной функции. Фильтры, в которых отклик не может быть вызван линейной функцией от значений атрибутов элементов изображения, являются нелинейными.

При организации сканирования изображений апертурой используют три схемы обработки, обычно обозначающиеся буквами Р, S, Т.

P-схема обработки соответствует случаю, когда окно (ни один его элемент) не может выходить за пределы фильтруемого поля.

S-схема обработки разрешает выход краёв окна за пределы поля, но центр апертуры должен всегда находится внутри поля.

Т-схема обработки соответствует фильтрации на так называемой тороидальной поверхности [91].

Поскольку в данном исследовании изображения, подвергающиеся фильтрации, значительно, на несколько порядков, больше размеров скользящего окна (рассматриваются объекты размерами от 4239x1630 до 11304x4348 пикселов при размерах апертуры 3x3 - 3x5 элементов) и имеет место быть дублирование частей изображения при поэтапной съемке всего объекта, в данной работе применяется Р-схема обработки.

 
Посмотреть оригинал
< Пред   СОДЕРЖАНИЕ   ОРИГИНАЛ   След >