ОПИСАНИЕ РАЗРАБОТАННОЙ ПОДСИСТЕМЫ РАСПОЗНАВАНИЯ РУКОПИСНОГО ТЕКСТА И РЕЗУЛЬТАТЫ ЭКСПЕРИМЕНТА

Последовательность распознавания рукописного текста в общем виде

В данном параграфе будут детализированы отдельные элементы созданной подсистемы, а также приведены блок схемы алгоритмов.

Математические формулы работы подпрограммы поиска и извлечения рукописных слов из анализируемого изображения приведены в параграфах 2.2-=-2.9. Внешний вид подсистемы распознавания и работа с элементами управления описаны в параграфе 4.8.

Листинги отдельных подпрограмм приведены в главе 5. Результаты экспериментов показаны в главе 5.

Блок-схема предварительных операций, которые необходимо было выполнить до начала процесса распознавания [117] показана на рисунке 4.1.

В рамках представленной работы выполнены следующие подготовительные операции:

  • 1 Собраны образцы почерков с использованием подготовленных бланков.
  • 2 С применением разработанного алгоритма извлечения слов из изображения из заполненных бланков извлечены рукописные слова.
  • 3 Выполнена идентификация и нумерация изображений слов, выполняемая на разработанном авторами программном обеспечении, создана база данных для последующей работы.
  • 4 Разработана подпрограмма создания моделей слов.

Очистка изображения от оптических помех не выполнялась по причине высокого качества исходных материалов.

Синтез словаря рукописных слов не проводился, для наполнения базы данных слов для последующего моделирования были использованы слова из первой части бланков.

Слова из вторых частей бланков использовались для распознавания на основе созданных моделей.

На рисунке 4.2 показана Блок-схема процесса распознавания.

Блок-схема предварительных операций

Рис. 4.1. Блок-схема предварительных операций

Блок-схема процесса распознавания

Рис. 4.2. Блок-схема процесса распознавания

Подпрограмма рекурсивного извлечения элементов слов из изображения

Для работы подпрограммы извлечения слов используются изображения формата *.bmp, с глубиной цвета 24bit. Данный формат выбран исходя из соображений удобства обработки изображений и отражения промежуточных итогов преобразования [107]. Работа с изображением производится с использованием функции ScanLine(i), где с аргументом i передается номер горизонтальной строки изображения. Для этапа поиска слов изображение переводится в бинарный массив, количество строк которого соответствует вертикальному размеру изображения в пикселях, а количество столбцов - горизонтальному размеру. Бинаризация осуществляется по следующему принципу. Пиксель присутствует, если интенсивность каждой из трех компонент менее 125, в противном случае, пиксель считается засвеченным (отсутствующим). Одновременно отмечаются присутствующие соседние пиксели. Соседними считаются восемь ближайших пикселей.

Формирование участков изображения с текстом производится с использование рекурсивной процедуры.

Извлеченные из изображения участки текста объединяются в слова с использованием математических вычислений, описанных в параграфе 2.3. Полученные слова нормируются по высоте. Высота извлеченного изображения слова после нормирования - 120 пикселей. Длина изображения изменяется пропорционально исходной длине.

Извлеченные слова маркируются и сохраняются в промежуточный каталог «/Extraction». Маркировка выполняется с сохранением информации о месторасположении слова в тексте. Маркировка включает в себя номер строки и номер слова в строке. Это сделано для правильного отображения положения слова в тексте после его распознавания.

Структурная блок-схема подпрограммы извлечения слов из изображения приведена на рисунке 4.3.

 
Посмотреть оригинал
< Пред   СОДЕРЖАНИЕ   ОРИГИНАЛ   След >