Распознавание площадных элементов на топографических картах

Библиографическое описание статьи для цитирования:
Дмитриев Н. В., Тарасян В. С. Распознавание площадных элементов на топографических картах // Научно-методический электронный журнал «Концепт». – 2017. – Т. 39. – С. 3476–3480. – URL: http://e-koncept.ru/2017/971022.htm.
Аннотация. В статье исследовано применение гистограммного подхода и теории клеточных автоматов при распознавании площадных объектов на топографической карте для построения геоинформационной системы местности. Для созданного алгоритма и программной реализации было проведено экспериментальное исследование с целью улучшения быстродействия и качества работы. В качестве критериев оптимизации выбраны параметры алгоритмов непосредственного распознавания и постобработки. Полученные результаты позволяют рекомендовать использование созданного алгоритма для распознавания площадных объектов топографических карт.
Комментарии
Нет комментариев
Оставить комментарий
Войдите или зарегистрируйтесь, чтобы комментировать.
Текст статьи
Дмитриев Никита Владимирович,аспирант, заведующий лабораториями кафедры «Мехатроника», ФГБОУ ВО Уральский государственный университет путей сообщения, г. Екатеринбургdmitrievnikita13@gmail.com

Тарасян Владимир Сергеевич,к. ф. м. н., доцент, заведующий кафедры «Мехатроника», ФГБОУ ВО Уральский государственный университет путей сообщения, г. Екатеринбургvtarasyan@gmail.com

Распознавание площадных элементов на топографических картах

Аннотация.В статье исследовано применение гистограммного подхода и теории клеточных автоматов при распознавании площадных объектов на топографической карте для построения геоинформационной системы местности. Для созданного алгоритма и программной реализации было проведено экспериментальное исследование с целью улучшения быстродействия и качества работы. В качестве критериев оптимизации выбраны параметры алгоритмов непосредственного распознавания и постобработки. Полученные результаты позволяют рекомендовать использование созданного алгоритма для распознавания площадных объектов топографических карт.Ключевые слова: топографические карты, ГИС, гистограммы, клеточный автомат, распознавание объектов.

Введение

В настоящее время широкое развитие получили автоматизированные системы, позволяющие преобразовывать топографические карты (ТК) в геоинформационные системы (ГИС) местности. Применение таких систем позволяет принимать более точные решения при проектировании объектов транспортнойи логистическойинфраструктуры, коммуникаций, рассчитывать возможные территории затопления при разливе рек и возможные траектории распространения лесных пожаров, исследовать состояние грунтов и растительности. Существующие программные решения позволяютлишь грубо распознавать двумерные элементы с помощью операций на основе пороговых методов и кластеризации. Поэтому построение системы, способной выполнять более интеллектуальное распознавание представляет собой актуальную задачу. В целом данное исследование является частью работы по созданию системы, автоматизирующей рутинную работу оператора, занимающегося преобразованием топографических карт в ГИС. Поэтому ставится общая задача повышения быстродействия работы алгоритмов и уменьшения ошибочных заключений,на исправление которых тратится работа оператора.Топографические карты,как объект исследования,считаютсясложноструктурными цветными изображениями низкого качества, пример представлен на рис. 1а. Необходимо использовать знаниевый подход, чтобы работатьс такими объектами [1].

С точки зрениятеориираспознавания образов, основной проблемой распределённых двумерных объектов, таких как однородные площади растительности различного типа (лесов, вырубок и садов) или грунтов, плоских водных объектов (озёр и морей), являются следующие особенности.

Вопервых, это пространственная протяжённость, так как мы не знаем заранее возможных границ отдельных двумерных объектов, как, например, в случае точечных объектов типа символов. Кроме того двумерные объекты имеют значительное количество пересечений с другими линейными и точечными объектами, так как выполняют функцию заднего фона, что усложняет поиск их границ, в том числе внутренних. Вовторых, это особенности полиграфии, так как часто вместо того, чтобы использовать определённый цвет для отображения областей, используется комбинация различных цветов в некоторой пропорции, которая выглядит со стороны как отдельный цвет. Таким образом, распознавание площадного объекта не может быть осуществимо за счёт распознавания пикселей, его составляющих, то есть индуктивный метод не применим. И наоборот, распознавая некоторую область как обладающую некоторым типом, мы можем заключить, что составляющие её пиксели обладают тем же типом с некоторой степенью принадлежности. Кроме тогограницы между различными объектами оказываются размытыми высококонтрастным дискретным шумом, что приводит к невозможности определения границ способами, использующимися для определения линейных объектов [2].Цель работы: разработать алгоритм распознавания площадных объектов за счёт преобразования топографической карты в карту, содержащую классы площадных объектов.

Разработанный алгоритм

В целом любой алгоритм обработки цифровых изображений с целью распознавания состоит из трёх этапов: предобработки, собственно распознавания и постобработки. Основная процессорная нагрузка при этом приходится на этап распознавания, поэтому алгоритмическая оптимизация данного этапа представляется нам наиболее важной.Предобработка.Чтобы решить задачу распознавания двумерных объектов на топографической карте необходимо сначала очистить её от всех посторонних объектов, то есть осуществить первичную бинарную классификацию по макроклассам «задний фон» и «передний фон». Это можно осуществить с помощью простых пороговых методов, так как тут не важна большая точность: в любом случае определить, к какому классу принадлежат пиксели за нарисованными горизонталями и надписями невозможно [3]. Но можно сделать предположение, что эти пиксели имеют такой же класс, что и соседние, которые точно принадлежат к макроклассу «задний фон».После удаления пикселей «переднего фона» получается двумерная карта с разрывами, которые необходимо устранить, так как они могут помешать дальнейшему распознаванию за счёт возникновения большого количества краевых условий, что приведёт к снижению быстродействия и качества. Особенно таких разрывов много в месте высокой плотности элементов «переднего фона», например, при изображении резких склонов, так как при этом горизонтали рисуются очень плотно друг другу, часто смыкаясь.Устранение разрывов достигается путём интерполяции значений пикселей «заднего фона», для чего можно использовать фильтры размытия. Чтобы интерполяция была произведена качественно, необходимо несколько раз выполнить операцию размытия, поэтомумы использовали фильтр Гаусса. Кроме того, с помощью этого же фильтра была произведена экстраполяция во внешнюю сторону относительно содержания карты для дальнейшего применения.Результаты работы предобработки представлены на рис. 1б. Видно, что двумерныеобласти «заднего фона» остались нетронутыми, а пиксели «переднего фона» приняли цвет, похожий на цвета соседних пикселей. При этом общая структура ТК с точки зрения классификации площадных объектов не была нарушена.

Рис. 1. а) Участок топографическойкарты;б) результат постобработки топографической карты

Распознавание.Существуют различные способы распознавания площадных объектов, но нам нужно воспользоваться знаниями об изображении тех или иных классов на поверхности карты. Эти знания мы можем получить из документов, содержащих условные изображения и пояснения. Поверхности имеют основной цвет заливки, но могут дополняться знаками не более трёх видов. Основные классы двумерных объектов и их особенности представлены в таблице 1.Стоит отметить, что изза выгорания и истирания топографических карт цвета могут меняться. Также стоит отметить, что мера заполнения краской зачастую не соответствует предъявленным требованиям и может значительно варьироваться в разных частях карты. Кроме того осложнением является нестрогое следование стандартам при выборе цветов.Учитывая приведённые примеры, становится видно, что площадные объекты стоит распознавать только областями, а не попиксельно. Кроме того, хоть и при изображении получаются значимые шумы, но в целом следует отметить статистическое постоянство в вариативности отклонения цвета и её частоте даже в небольших областях. Поэтому было сделано предположение об использовании гистограммного подхода в анализе топографических карт для распознавания площадных объектов.Данный подход уже был исследован ранее [4, 5], но не для случая топографических карт. Также хочется подчеркнуть, что данный подход может решить задачу классификации областей с использованием специальных символов (изображение песка, болот, ледников) без непосредственного их распознавания, так как частоту наличия этих символов через их цвета можно учесть в гистограмме. Но такое относится только к символам различных цветов: данным способом нельзя отличить, например, кустарники от травяных зарослей.В итоге при анализе были получены эталонные гистограммы различных классов площадных объектов. Так как ТК представляют собой цветные изображения, то каждому классу соответствует три гистограммы по каждой из координат цветового пространства. Ширина интервалов соответствует 2% от ширины общего интервала возможных значений цвета. Из эталонных гистограмм были получены значимые значения цветов для каждого из классов, то есть интервалы, имеющие наибольшие значения.

Таблица 1Основные классы площадных объектов топографических карт.

Класс объектаПример изображенияОсобенности изображенияПлощади кварталов неогнестойких строений

Цвет 255812 (оранжевый), 100% заполненияПлощади кварталов огнестойких строений, полотно автомобильных дорог

Цвет 255810 (оранжевый), 100% заполненияОбъекты гидрографии

Цвет 255838 (синий), 30% заполненияПлощади лесов и садов

Цвет 255845 (зелёный), 100% заполненияПлощади низкорослой растительности

Цвет 255845 (зелёный), 50% заполненияРедколесье, ледники, степи и каменистые поверхности

Отсутствие краски (белый цвет)(Конкретный класс определяется за счёт специальных символов)

При этом мы используем три независимые линейные гистограммы, а не одну трёхмерную гистограмму, так как это упрощение позволительно сделать, учитывая особенности карты, например, наличие большой зелёной и красной составляющей вместе низкой синей составляющей говорит именно о наличии цвета площади кварталов неогнестойких строений, а не о смеси красных и зелёных точек.Набор исследуемых областей можно получить с помощью метода скользящего окна некоторого размера. Далее для каждой такой области строятся три цветовых гистограммы и вычисляется мера по значимым цветам каждого из класса:

где class–идентификатор класса площадного объекта, c–номер цветовой координаты, hist–значения гистограммы для данной цветовой координаты, intervals–множество интервалов гистограммы, необходимых для данного класса, S–площадь скользящего окна. Чем ближе значение вычисленной меры к единице, тем больше это отражает то, что область принадлежит данному классу.Теперь для каждого окна необходимо найти тот класс, для которого вычисленные меры для всех трёх координат цветового пространства окажутся не меньше определённого значения и максимальными относительно других. Если такой класс не был найден, то оставляем на данном этапе данную область неклассифицированной.Результаты данного этапа для ширины скользящего окна равного четырём представлены на рис. 3. Для удобства полученная карта классов выкрашена в соответствии с требованиями к изображению ТК. Результат демонстрирует хорошие результаты распознавания, большинство пикселей определены правильно.Постобработка.Проблема методики распознавания, изложенной выше, обладает двумя несовершенствами: вопервых, статистически всётаки может произойти так, что какаято область может быть причислена к неправильному классу, и, вовторых,наличие неклассифицированных областей. Тем не менее, работа уже сделана и на исправление ошибок можно затратить более сложные и производительные методы.Исходя из предположения об однородности площадных объектов (то есть отсутствии вкраплений пикселей и небольших сегментов другого класса внутри одного) и хороших результатов распознавания мы можем сделать вывод о том, что ошибочно классифицируемые и неклассифицированные пиксели обладают тем же классом, что и окружающие их. Поэтому мы можем применить алгоритм наподобие клеточного автомата Конвея «Жизнь» [6], в котором клетками будут пиксели, а множеством состояний –классы, включая отсутствие класса. Под окрестностью понимается окрестность Мура порядка 1. Так как состояний больше двух, то правила «оживления» и «смерти» заменяются правилом перехода одного класса в другой.Стратегия правила перехода текущего состояния клетки может быть различной: жёсткой и мягкой. Она зависит от минимального количества клетоксоседей мажоритарного класса окрестности пикселя. Неклассифицированные клетки не могут влиять на окрестности, даже если они находятся в большинстве.Изначально мы проверяем все пикселиклетки, но после их верификации они исключаются из дальнейшего итеративного процесса. Итерации возникают, так как некоторые пиксели могут достаточно долгое время не быть верифицированы изза отсутствия мажоритарного класса окрестности пикселя. Чтобы окончить этот процесс необходимо через некоторое количество итераций ослабить требования правила перехода.

Оценка качества распознавания

Как уже было сказано ранее основным параметром оценивания является совокупное быстродействие системы компьютерчеловек. Необходимо соблюсти оптимальный баланс между временем работы программы и количеством ошибок, так как некоторые операции (поиск и исправление конкретных ошибок) оператор может выполнить быстрее, чем программа.Оценка быстродействия выполнялась за счёт просчёта времени работы программы. Оценка качества распознавания выполняется отдельными критериями: количество неклассифицированных пикселей на втором этапе и количество пикселей, поменявших класс на третьем.В качестве критериев оптимизации были выбраны размер скользящего окна и количество интервалов значимых цветов гистограмм со второго этапа и минимальное количество соседей окрестностей пикселя для изменения класса из третьего этапа (жёсткая стратегия –не меньше 6и, мягкая –не меньше 4х).

Экспериментальные результаты

Эксперимент проводился в среде Matlabс помощью реализации представленного алгоритма в виде программного кода. Результаты исследования показали, что на время обработки оператора большее влияние оказывает скорее форма редактируемых областей, а не их размеры, которые можно связать с параметрамиалгоритма. Форма же областей основывается на содержании карты: чем больше плотность объектов, тем сложнее форма и требуется больше времени на её обработку.В таблице 2 представлены результаты в соответствии с различными начальными установками критериев оптимизации.Так как неклассифицированные пиксели возникают на втором этапе и должны быть полностью обработаны в третьем, то их процент на втором этапе не зависит от стратегии правила перехода между классами. На рис. 2 представлены результаты второго и третьего этапов, соответственно, при оптимальном быстродействии.



Рис. 2. а) результаты распознавания после второго этапа;б) результаты распознавания после постобработки

Таблица 2Критерии качества в зависимости от различных критериев оптимизации.

Критерии оптимизацииКритерии качестваКоличество интервалов гистограммыШирина скользящего окнаСтратегия правила переходаВремя работы алгоритма, секПроцент неклассиф. пикселей, %Процент ошибочно классиф. пикселей, %Большее(не меньше пяти)3жёсткая80,811,99,9мягкая70,213,24жёсткая82,910,99,0мягкая70,613,15жёсткая84,311,17,7мягкая72,512,46жёсткая89,311,87,3мягкая75,611,9Меньшее(меньше пяти)3жёсткая87,212,58,8мягкая77,812,44жёсткая90,112,17,9мягкая79,812,05жёсткая91,212,37,0мягкая80,711,76жёсткая94,312,66,8мягкая83,811,1

Выводы

В данной статье исследовалась возможность применения гистограммного подхода и теории клеточных автоматов для распознавания площадных объектов на топографических картах. Согласно полученным экспериментальным данным можно сделать вывод, что увеличение скользящего окна, уменьшение количества интервалов значимых цветов гистограммы и введение жёсткой стратегии увеличивает время обработки и уменьшает процент ошибочно классифицируемых пикселей. Процент неклассифицированных пикселей уменьшается с увеличением шириныскользящего окна и потом снова увеличивается. Из этого можно сделать вывод, что оптимальными критериями будет использование мягкой стратегии перехода, использование большего количества интервалов гистограммы для вычисления меры и использование ширины окнаравной 4ем. Результат оказался предсказуемым, так как топографические карты представляют собой сложноструктурные изображения и нужно использовать большее количество информации и более гибкие техники.Кроме того построенный алгоритм позволяет классифицировать некоторые площадные объекты, которые характеризуются не площадными характеристиками, а точечными символами. Тем не менее, необходимо исследовать этот вопрос в комплексной обработке двумерных и точечных объектов для полного классифицирования областей, так как в настоящее время проведено распознавание только общих классов площадных объектов, которые можно конкретизировать.Разработанный алгоритм обладает теоретической значимостью, так как рассмотренный гистограммный подход впервые применён в распознавании образов на таких сложноструктурных объектах, как топографические карты. Показано, как может быть применён такой подход, какие возникают особенности и проблемы.Полученные результаты в виде программного модуля можно внедрить в разрабатываемое программное обеспечение, которое в дальнейшем может быть внедрено на предприятиях, занимающихся разработкой и проектированием геоинформационных систем, таких как Уралгеоинформ.

Ссылкинаисточники1.Szendrey R. A knowledgebased approach to rastervector conversion of large scale topographic maps / R. Szendrey, I. Elek, M. Marton // Acta Cybernetica, 2011. —V. 20(1). —p. 145165.2.ТарасянВ. С., Дмитриев Н. В. Сравнение методов сегментации пикселей топографических карт по типам объектов / В. С. Тарасян, Н. В. Дмитриев // Известия Тульского государственного университета: технические науки. –Тула: Тульский государственный университет. –2016. –№ 3. –с. 97106.3.Сойфер В. А. Методы компьютерной обработки изображений / В. А. Сойфер. —2е изд. —М.: ФИЗМАТЛИТ, 2003. —784 с.4.Linde O, Lindeberg T. Composed ComplexCue Histograms: An Investigation of the Information Content in Receptive Field Based Image Descriptors for Object Recognition / O. Linde, T. Lindeberg // Computer Vision and Image Understanding, 2012. —V. 116 (4). —p. 538560.5.Laptev I. Improving object detection with boosted histograms / I. Laptev // Image and Vision Computing archive, 2009. —V. 27 (5). —p. 535544.6.Gardner M. Mathematical Games –The fantastic combinations of John Conway's new solitaire game "life" / M. Gardner // Scientific American, 1970. —V. 223. —p. 120123.