Хорошо известно, что зерновка даже определённого сорта любой культуры обладает широко вариабельными свойствами, в том числе цветовой гаммы и геометрической формы. Широкая вариабельность признаков зерновок одна из основных проблем при идентификации. В [2-3] предлагается основанная на Фурье-анализе и статистической теории распознавании образов методика идентификации зерновок по геометрической форме их контуров, с погрешностью при разделении сортов в доли процентов. Но если для риса очертания контура генетически наследуемый признак, то для прочих культур очертания позволяют распознать не сорта, а только виды (пшеница или рис, или соя и т.д.) между собой. Дальнейшее развитие метода возможно, если при анализе каждого объекта учитывать не только его контур, но и цветовые характеристики - общий цветовой фон, локальные всплески отдельных оттенков и т.д. [3]. Для анализа цветовой составляющей исследуемых объектов перспективен метод двумерного дискретного вейвлет-преобразования, зарекомендовавший себя в работах по сжатию изображений.
Созданная «обучающая» БД предназначена для решения следующих задач [3-5]:
- a) высокоточная идентификация сорта для изображения злаковых и масличных культур;
- b) определение его количественного содержания в смеси сортов;
- c) наличие дефектов внешних повреждений на поверхности зерновки;
- d) наличие посторонних примесей в зерновой массе и их идентификация;
- e) идентификация в зерновой массе обрушенных, целых и дроблёных ядер.
Разработанное программное обеспечение и созданная экспериментальная установка (рис. 1) реализуют следующие этапы создания «обучающей» БД для спектрального анализа плоского изображения зерновок, достигающего полной нормализации результатов вне зависимости от изначального положения объекта на плоскости относительно произвольной системы координат:
Рис. 1. Схема установки и этапы создания «обучающей» БД:
1 - ёмкость с непрозрачными стенками, 2 - матовое стекло, 3 - отверстие для фотоаппарата, 4 - лампы искусственного освещения, 5 - поддон для зерна, 6 - зёрна
1) провести фотосъёмку зерновок известного сорта на однотонном фоне;
2) применить алгоритмы отделения фона и выделения пиксельных изображений отдельных единичных зерновок;
3) установить центр масс объекта, угол поворота относительно начальной системы координат и размеры каждого изображения, перенести начало координат в центр масс объекта и произвести поворот осей координат таким образом, чтобы ось абсцисс проходила вдоль максимального удлинения объекта;
4) нормализовать размеры объекта таким образом, чтобы вне зависимости от разрешения анализируемого изображения геометрические размеры всех объектов совпадали;
5) провести дискретное вейвлет-преобразование цветовых составляющих всех точек (пикселей), принадлежащих выделенной в предыдущих пунктах области; упорядочить полученные коэффициенты; отбросить незначащие элементы полученного упорядоченного массива;
6) сохранить полученные данные в БД единичных вейвлет-спектров.
7) Для нейросетевых методов распознавания БД единичных вейвлет-спектров является обучающей выборкой.
8) Для статистических методов распознавания построение БД эталонных для каждого сорта эллипсоидов рассеивания.
Этапы 1-4, 7 описаны в [6-9, 3] и далее ниже не рассматриваются.
Для получения характеристик окраски и формы зерна более предпочтительным является дискретное вейвлет (wavelet)преобразование. Окраска зерна представлена в виде матрицы пикселей (рис. 2). Каждый пиксель разложен на цветовые компоненты в пространстве {R, G, B}-палитры, R-красный, G-зелёный, B-синий. Необходимо найти вейвлет-спектры функций цвета R(c, r), G(c, r) и B(c, r), где c и r - координаты пикселя.
Рис. 2. Представление окраски зерна
Основная идея вейвлетного анализа - представить данные в виде грубого приближения и детализрующей информации. Детализирующей информации тем больше, чем выше уровень детализации (частота). Уровню разрешения (детализации) i соответствуют 2i детализирующих коэффициента (вейвлет-коэффициента). С ростом уровня детализации усиливается пространственная локализация преобразования. Обращением малых по абсолютной величине вейвлет-коэффициентов в ноль можно добиться сокращения объёмов информации. Двумерное вейвлет-преобразование представляет собой свёртку исходного сигнала с низкочастотными и высокочастотными фильтрами, порождающими грубую аппроксимацию и детализирующие коэффициенты. В одномерном случае применение дискретного вейвлет-преобразования (DWT) - это «обычная фильтрация». Из строки x мы получаем строку y по следующим формулам свёртки [10]:
где hH , hL - ядро свёртки, фильтры высокочастотный и низкочастотный. Получение коэффициентов вейвлет-преобразования наиболее эффективно с помощью системы скейлинг-функций Хаара. В двумерном случае - для плоских изображений - эти формулы первоначально применяются по всем строкам, а потом ко всем столбцам изображения. Результирующий спектр состоит из спектров цветовых компонент R, G и B, взятых независимо друг от друга.
Таким образом, (1)-(2) позволяют рассчитывать спектры плоского изображения любого единичного представителя какого-либо компонента зерновой массы. В связи с высокой вариабельностью геометрических размеров и формы зерновки, спектры компонентов зерновой массы представлялись случайным N-мерным вектором, построенным на основе объёма выборки n («обучающей выборки»), гарантирующей требуемую точность идентификации. После подсчёта эмпирического распределения вероятностей случайного вектора Z→ ,доверительных интервалов его центра рассеивания M→ ={M0,...,M N-1} и дисперсии D→ ={σ0,...,σ N-1} проводилась проверка статистических гипотез о нормальности распределения, значимости коэффициентов корреляции r i,j для i-й и j-й координат . Эти спектры Z→ сохраняются в БД единичных вейвлет-спектров.
Для статистических методов распознавания построение БД эталонных для каждого сорта эллипсоидов рассеивания опирается только на требование нормальности генеральной совокупности и проводится следующим образом. Поверхности уровня плотности распределения вероятностей нормального случайного вектора задаются уравнением второго порядка
и являются эллипсоидами рассеяния. При достаточно большой константе в правой части (3), по правилу «трёх сигм», вероятность попадания спектра в эллипсоид рассеяния практически равна единице. Следовательно, если удастся выделить те гармоники в каждого сорта каждой культуры, чьи эллипсоиды рассеяния не пересекаются, погрешность такой идентификации будет практически равна нулю. Многомерная нормальная плотность распределения, как известно, имеет вид:
где N - размерность пространства; x - точка пространства (вектор); m - центр рассеяния (вектор мат. ожиданий); |B| - ковариационная матрица. Константу в правой части (3) можно определить через кратный интеграл от (4), что при непосредственном интегрировании встречает значительные трудности, но допускает сведение к алгебраическому уравнению следующим образом. Рассмотрим множество точек, удовлетворяющее уравнению f(x) = fel, где константа
регулирует вероятность попадания спектра в эллипсоид рассеяния и определяет пределы интегрирования в кратном интеграле. В системе координат с началом в центре рассеяния и преобразованной к каноническому виду (3) имеет вид
где k2 = является ко- эффициентом подобия полуосей ai эллипсо- ида. Если произвести в кратном интеграле от (4) замену на каноническую систему перемен- ных, то якобиан такого преобразования равен
Для вычисления коэффициента подобия эллипсоида, охватывающего заданный процент выборки, необходимо решить следующее уравнение относительно KP:
где FKP - заданный процент выборки, а KP - искомый коэффициент подобия эллипсоида, охватывающего заданный процент выборки.
Разработанный программный комплекс ADBViewer (рис. 3-4) включает этапы сбора спектров выборочной совокупности каждого сорта по их плоским изображениям, статистической обработки выборки и формирования базы данных эталонных спектров каждого сорта (содержит векторы средних дисперсий и корреляционные матрицы). Объектами исследований, как тестовыми для дальнейшего развития метода [3], являлись элитные сорта риса Краснодарский 424, Лиман, Кулон, Регул, Изумруд, произведенные на сортировочных участках ВНИИ риса. Представлены все ветви, группы и практически все классы, поскольку исследуемые сорта риса, согласно традиционной классификации профессора Г.Г. Гущина, относятся к китайско-японской ветви, за исключением сорта Изумруд из индийской ветви. Для нейросетевых методов распознавания ADBViewer включает обучающую выборку единичных вейвлет-спектров, для статистических - эталонные для каждого сорта эллипсоиды рассеивания.
Данная работа выполнена при финансовой поддержке Российского Фонда фундаментальных исследований и администрации Краснодарского края, грант №08-07-99033-р_офи.
Рис. 4. Пример расчёта спектра с помощью двумерного вейвлета Хаара для выборочной совокупности сорта риса Лиман: а - исходное изображение и выбор метода преобразования, б - спектр
Список литературы
- Brosnan T., Sun D.W. Improving quality inspection of food products by computer vision - a review // J. Food Engineering. - 2004. - Vol. 61. - P. 3-16.
- Теоретические и прикладные аспекты спектрального анализа контура изображения злаковых и масличных культур / А.Ю. Шаззо, С.В. Усатиков, Н.В. Мацакова, А.Н. Чуб // Известия вузов. Пищевая технология. - 2003. - №1. - С. 53-58.
- Классификация риса на основе спектрального анализа контура изображения зёрен / А.Ю. Шаззо, С.В. Усатиков, Н.В. Мацакова, А.С. Афанасьев, И.Р. Хуснутдинов, О.Г. Гриценко // Известия вузов. Пищевая технология. - 2005. -№5-6. - С. 19-23.
- Шаззо А.Ю. Вопросы разработки вычислительного ядра экспертных систем высокоточного распознавания компонентов и прогнозирования качества при хранении зерновой массы // Сб.тезисов Конф. получателей грантов регион. конкурса РФФИ и адм. Краснод. края «ЮГ РОССИИ». - Краснодар: НП ИТЦ «Кубань-Юг». - 2008. - С. 177-178.
- Шаззо А.Ю. Распознавание компонентов и прогнозирование качества при хранении зерновой массы // Сб.тезисов Конф. получателей грантов регион. конкурса РФФИ и адм. Краснод. края «ЮГ РОССИИ». - Краснодар: НП ИТЦ «Кубань-Юг». - 2009. - С. 128-129.
- Усатиков С.В., Руденко О.В., Горонков К.А. О точности распознавания по контуру изображений злаковых культур с помощью нейронных сетей // Обозр.прикл.и пром. математики. - 2009. - Т. 16, Вып. 3. - С. 567-569.
- Усатиков С.В., Горонков К.А. База данных спектров плоских изображений для высокоточного распознавания сортов зерновых культур // Автоматизир. информ. и электроэнергетич.системы: материалы I Межвуз. научно-практич. конфер. - Краснодар: Изд. Дом-Юг, 2010. - С. 144-146.
- Форсайт Д.А., Понс Ж. Компьютерное зрение. Современный подход. - М.: Изд. дом «Вильямс», 2004. - 928 с.
- Image Recognition and Classification: Algorithms, Systems, and Applications / edited by Bahram Javidi. - New York, Basel: Marcel Dekker, Inc., 2002. - 493 p.
- Уэлстид С. Фракталы и вейвлеты для сжатия изо бражений в действии.- М.: Изд. «Триумф», 2003. - 320 с.
Рецензенты:
- Глущенко Л.Ф., д.т.н., профессор, зав. кафедрой «Технология переработки с/х продукции» Новгородского государственного университета им. Ярослава Мудрого, г. Великий Новгород;
- Семенчин Е.А., д.ф.-м.н., профессор, зав. кафедрой высшей алгебры и геометрии Кубанского государственного университета МО РФ, г. Краснодар;
- Дударев Ю.И., д.т.н., профессор, профессор Кубанского государственного университета МО РФ, г. Краснодар.
Работа поступила в редакцию 09.03.2011
Библиографическая ссылка
Горонков К.А., Руденко О.В., Усатиков C.В. БАЗА ДАННЫХ ОБУЧАЮЩЕЙ ВЫБОРКИ ДЛЯ ВЫСОКОТОЧНОГО РАСПОЗНАВАНИЯ ПЛОСКИХ ИЗОБРАЖЕНИЙ СОРТОВ ЗЛАКОВЫХ И МАСЛИЧНЫХ КУЛЬТУР // Фундаментальные исследования. – 2011. – № 8-2. – С. 342-346;URL: https://fundamental-research.ru/ru/article/view?id=27960 (дата обращения: 09.11.2024).