Техническое зрение роботов
Рефераты >> Технология >> Техническое зрение роботов

2.4.3.Определение эталонного образа.

Успех применения методов зависит от эталон­ного образа, относительно которого проводятся дальнейшие сравнения. Как уже говорилось выше, различие между двумя образами в задаче распознавания движущихся объектов опре­деляется путем исключения стационарных компонент при сохра­нении элементов, соответствующих шуму и движущимся объек­там. Проблема выделения образа из шума решается методом фильтрации или с помощью формирования изображения акку­мулятивной разности.

На практике не всегда можно получить эталонный образ, имеющий только стационарные элементы, и это приводит к не­обходимости построения эталона из набора образов, содержа­щих один или более движущихся объектов. Это особенно харак­терно для ситуаций, описывающих сцены со многими быстро­меняющимися объектами или в случаях, когда возникают частые изменения сцен. Рассмотрим следующую процедуру гене­рации эталонного образа. Предположим, что мы рассматриваем первый образ последовательности в качестве эталонного. Когда нестационарная компонента полностью вышла из своего положе­ния в эталонном кадре, соответствующий фон в данном кадре может быть перенесен в положение, первоначально занимаемое объектом в эталонном кадре. Когда все движущиеся объекты полностью покинули свои первоначальные положения, в резуль­тате этой операции воссоздается эталонный образ, содержащий только стационарные компоненты. Перемещение объекта можно определить с помощью операции расширения положительного изображения аккумулятивной разности.

3.ОПИСАНИЕ

В системах технического зрения проблемой описания назы­вается выделение свойств (деталей) объекта с целью распозна­вания. В идеальном случае дескрипторы не должны зависеть от размеров, расположения и ориентации объекта, но должны содержать достаточное количество информации для надежной идентификации объектов. Описание является основным резуль­татом при конструировании систем технического зрения в том смысле, что дескрипторы должны влиять не только на слож­ность алгоритмов распознавания, но также и на их работу. рассмотрим три основные катего­рии дескрипторов: дескрипторы границы, дескрипторы области и дескрипторы для описания трехмерных структур.

3.1.Дескрипторы границы.

3.1.1.Цепные коды.

Цепные коды применяются для представления границы в виде последовательности отрезков прямых линий определенной длины и направления. Обычно в основе этого представления лежит 4- или 8-связная прямоугольная решетка. Длина каждого отрезка определяется разрешением решетки, а направления задаются выбранным кодом. Отметим что для представления всех направлений в 4-направленном цеп­ном коде достаточно 2 бит, а для 8-направленного цепного кода требуется 3 бит. Для порождения цепного кода заданной границы сначала выбирается решетка. Тогда, если площадь ячейки, расположенной внутри границы, больше определенного числа (обычно 50%), ей присваивается значение 1; в противном слу­чае этой ячейке присваивается значение 0. Окон­чательно мы кодируем грани­цу между двумя областями, используя направления. Результат кодирования в на­правлении по часовой стрелке с началом в месте, помеченном точкой. Альтернативная процедура состоит в разбиении границы на участки равной длины (каждый участок имеет одно и то же число пикселов) и соединении граничных точек

каждого участка прямой линией, а затем присваивания каждой линии направления, ближайшего к одному из допустимых направлений цепного кода. Важно отметить, что цепной код данной границы зависит от начальной точки. Однако можно нормировать код с помощью простой процедуры. Для создания цепного кода начальная точка на решетке выбирается произвольным образом. Рассмат­ривая цепной код как замкнутую последовательность индексов направлений, мы вновь выбираем начальную точку таким обра­зом, чтобы результирующая последовательность индексов была целым числом, имеющим минимальную величину. Также можно нормировать повороты, если вместо цепного кода рассматри­вать его первую разность. Первая разность вычисляется в ре­зультате отсчитывания (в направлении против часовой стрелки)' числа направлений, разделяющих два соседних элемента кода. Например, первая разность для цепного кода с 4 направле­ниями 10103322 есть 3133030. Если рассматривать код как зам­кнутую последовательность, тогда первый элемент разности можно вычислить, используя переход между последним и пер­вым компонентами цепи. В данном примере результатом яв­ляется 33133030. Нормирование можно осуществить путем раз­биения всех границ объекта на одинаковое число равных сег­ментов и последующей подгонкой длин сегментов кода с целью их соответствия этому разбиению.

Изложенные методы нормирования являются точными толь­ко в том случае, когда сами границы инвариантны к повороту и изменению масштаба. Этот случай редко встречается на прак­тике. Например, один и тот же объект, разбитый на элементы в двух различных направлениях, как правило, имеет разную форму границы, причем степень различия пропорциональна раз­решающей способности изображения. Этот эффект можно умень­шить, если выбирать длины элементов цепи большими, чем рас­стояния между пикселами дискретного образа, или же выбирать ориентацию решетки вдоль главных осей кодируе­мого объекта.

3.1.2.Сигнатуры.

Сигнатурой называется одномерное функциональ­ное представление границы. Известно несколько способов соз­дания сигнатур. Одним из наиболее простых является построе­ние отрезка из центра к границе как функции угла. Очевидно, что такие сигнатуры зависят от периметра области и начальной точки. Нормирование периметра можно осуществить, пронормировав кривую r(q) максимальным значением. Пробле­му выбора начальной точки можно решить, определив сначала цепной код границы, а затем применив метод, изложенный в пре­дыдущем разделе. Конечно, расстояние, зависящее от угла, не является единственным способом определения сигнатуры. Напри­мер, можно провести через границу прямую линию и определить угол между касательной к границе и этой линией как функцию положения вдоль границы. Полученная сигнатура, хотя и от­личается от кривой r(q), несет информацию об основных харак­теристиках формы границы. Например, горизонтальные участки кривой соответствовали бы прямым линиям вдоль границы, по­скольку угол касательной здесь постоянен. Один из вариантов этого метода в качестве сигнатуры использует так называемую функцию плотности наклона. Эта функция представляет со­бой гистограмму значений угла касательной. Поскольку гисто­грамма является мерой концентрации величин, функция плотно­сти наклона строго соответствует участкам границы с постоян­ными углами касательной (прямые или почти прямые участки и имеет глубокие провалы для участков, соответствующих быст­рому изменению углов (выступы или другие виды изгибов).

3.1.3.Аппроксимация многоугольниками.

Дискретную границу с произвольной точностью можно аппроксимировать многоуголь­никами. Для замкнутой кривой аппроксимация является точ­ной, когда число сегментов в многоугольнике равно числу точек границы, так что каждая пара соседних точек определяет сег­мент многоугольника. На практике целью аппроксимации мно­гоугольниками является качественное определение формы гра­ницы с помощью минимального числа многоугольных сегментов. Хотя обычно эта проблема нетривиальна и довольно быстро сво­дится к итеративному поиску, требующему больших временных затрат, имеется ряд методов аппроксимации многоугольниками, относительная простота которых и требования к обработке дан­ных делают их пригодными для приложений в области техниче­ского зрения роботов.


Страница: