ПЕРСПЕКТИВЫ И ОГРАНИЧЕНИЯ ИСПОЛЬЗОВАНИЯ ГЕОМЕТРИЧЕСКИХ МЕТОДОВ РАСПОЗНАВАНИЯ АКУСТИЧЕСКИХ ОБРАЗОВ МОРСКИХ ОБЪЕКТОВ ПРИМЕНИТЕЛЬНО К ЗАДАЧЕ УПРАВЛЕНИЯ НЕЙРОСЕТЕВОЙ ЭКСПЕРТНОЙ СИСТЕМОЙ - Фундаментальные исследования (научный журнал)

Пятакович В.А. 1 Василенко А.М. 1

1 ФГКВОУ ВО «Тихоокеанское высшее военно-морское училище имени С.О. Макарова»

Материал очередного этапа исследований авторского коллектива в публикуемой работе представлен в виде проведенного анализа геометрических методов распознавания применительно к задаче управления нейросетевой экспертной системой классификации объектов по их акустическим излучениям. Показаны достоинства и недостатки данных методов, возможные ограничения для их использования. Рассмотрены наиболее перспективные из них, используемые при решении задач распознавания в системах управления, когда субъективный человеческий фактор отсутствует, т.е. решение по результатам предварительной классификации и окончательного распознавания объекта система должна принять полностью самостоятельно. При реализации в структуре приемного тракта радиогидроакустической системы мониторинга морских акваторий разрабатываемой нейросетевой экспертной системы для анализа, распознавания и классификации ненадежных и слабоформализированных входных данных, получаемых в результате измерения информационных полей атмосферы, океана и земной коры, будет обеспечена оперативность получения данных информационно-аналитическим центром системы мониторинга, возможность целенаправленного и управляемого контроля в решении многофункциональных задач морской науки, оборонного и народно хозяйственного комплексов государства. Результаты научных разработок авторов по данной тематике защищены патентами, изданы в виде монографий и отражены в научных статьях.

Рецензия № 1

2079 KB

Рецензия № 2

144 KB

Статья в формате PDF

0 KB

система мониторинга морской среды

классификация морских объектов

математическая модель

образы морских объектов

обучающие алгоритмы нейронных сетей

этапы формирования обучающей выборки

1. Аркадьев А.Г., Браверманн Э.М. Обучение машины распознаванию образов. – М., 1964. – 114 с.

2. Благин Ю.В. Отечественная мина-торпеда ПМТ-1 [Текст] / Ю.В. Благин // Морской сборник. – 1997. – № 7. – С. 61–63.

3. Богданов В.И., Петров Б.Н., Фокин А.В. Распознавание образов состояния Мирового океана с помощью спутникового сканера. [Текст] / В.И. Богданов // Техника. – 1997. – № 12. – С. 8–14.

4. Богданов В.И. Геометрические методы распознавания образов [Текст] / В.И. Богданов, В.А. Пятакович, А.С. Потапов // Труды ДВГТУ. – Владивосток: ДВГТУ, 2001. – Вып. 131. – С. 179–186.

5. Будрик В.С. Анализ гидроакустических систем [Текст] / В.С. Будрик. – Л.: Судостроение, 1988. – 392 с.

6. Гуревич М.Ю. Алгоритмические схемы распознавания изображений двумерных объектов на основе адресных сортировок: дис. ... канд. техн. наук (05.13.17) / Гуревич Михаил Юрьевич; ТИ им. А.П. Чехова. – Таганрог, 2001. – 178 c.

7. Дуда Р., Харт П. Распознавание образов и анализ сцен. – М.: Мир, 1996. – 509 с.

8. Лямин Б.С., Михайлов В.А. Первая в мире морская реактивная мина // Морской сборник. – 1997. – № 8. – С. 55–57.

9. Пятакович В.А. Технологии нелинейной просветной гидроакустики и нейро-нечетких операций в задачах распознавания морских объектов [Текст]: монография / В.А. Пятакович, А.М. Василенко, М.В. Мироненко. – Владивосток: ДВФУ, 2016. – 190 с.

В работе рассмотрены наиболее перспективные геометрические методы, используемые при решении задач распознавания в системах управления, когда субъективный человеческий фактор отсутствует, т.е. решение по результатам предварительной классификации и окончательного распознавания морского объекта система должна принять полностью самостоятельно.

Цель исследования

Целью научно-технических разработок авторов статьи является создание широкомасштабной радиогидроакустической системы освещения атмосферы, океана и земной коры, мониторинга их полей различной физической природы и разработка нейросетевой экспертной системы (НЭС) распознавания и классификации в общей структуре просветной системы мониторинга, включая комплекс ее автоматизированного управления. НЭС и реализующая ее система направлены на решение задач дальнего параметрического приема, измерения и распознавания пространственно-временных и спектральных характеристик, динамики гидро- и геофизических волн, формируемых неоднородностями морской среды и дна.

Материалы и методы исследования

Все геометрические методы распознавания основаны на использовании некоторой функции подобия (принадлежности) S объекта данному классу. Функция S определяет некоторую меру близости объекта bj с координатами pjt01.wmf к множеству эталонов pjt02.wmf . Одна из наиболее употребимых мер степени близости – среднеквадратичное отклонение (среднеквадратическое расстояние) [1, 4, 6].

pjt03.wmf (1)

Метрика измерения степени близости (расстояния) может быть разной, но должна удовлетворять условиям

d (a, b) = d (b, a); (2)

d (a, c) ≤ d (a, b) + d (b, c); (3)

d (a, b) ≥ 0; (4)

d (a, b) = 0 только при а = b. (5)

При использовании метрики типа (1) процесс обучения при геометрическом подходе можно трактовать как задачу определения такой оптимальной метрики, при которой минимизировалось бы расстояние

pjt04.wmf (6)

где у_mi – i-ый эталон m-го класса. Двойная сумма в выражении (6) делится на pjt05.wmf , а не на pjt06.wmf , так как в соответствии с выражением (5) pjt07.wmf при j = i.

Следует отметить, что в системах распознавания мины «Captor» и отечественной мине-торпеде ПМТ-1 использовался именно геометрический метод распознавания в самой примитивной форме [2, 8]. В системах распознавания названных изделий использовался класс метрик, который описывается формулой

pjt08.wmf (7)

Необходимо найти такие коэффициенты wn, чтобы выражение (7) стало минимальным. Физический смысл весовых коэффициентов состоит в следующем. Будем считать, что два объекта а и b представляются признаками (точками) с координатами an и bn в N-мерной ортогональной системе координат некоторого абстрактного пространства (временного, евклидова, Фурье или другого). Расстояние между точками в этом пространстве можно определить по формуле

pjt09.wmf (8)

Для уменьшения роли малозначащих признаков обычно вводятся нормирующие весовые коэффициенты, т.е. вместо метрики (8) используется метрика вида (7).

Обычно при геометрической трактовке распознавания образов прибегают к интерпретации процесса в виде некоторого пространственного преобразования, при котором объекты одного класса сжимаются, а множества различных классов удаляются друг от друга.

Существуют самые различные (линейные, нелинейные) методы преобразований. Например, классикой в распознавании акустических образов является преобразование временного пространства в частотные [5, 9]. Частотный метод распознавания будет выделен и рассмотрен отдельно. Если ограничиться линейным преобразованием пространства признаков объекта, то преобразование можно задать матрицей.

pjt10.wmf (9)

Если в исходной системе координат заданы векторы объектов

pjt11.wmf

pjt12.wmf (10)

то преобразованные вектора (а', b') определяют как

pjt13.wmf (11)

а разность векторов – формулой

pjt14.wmf (12)

Евклидово расстояние между элементами в преобразованном пространстве равно

pjt15.wmf

pjt16.wmf

pjt17.wmf (13)

Геометрический смысл этой формулы заключается в том, что сначала определяется сумма (внутренняя) взвешенных расстояний n-м признаком по всем эталонам класса, а затем – сумма (внешняя) квадратов расстояний по всем признакам, т.е. в начале производится усреднение по эталонам, потом по признакам.

Диагональные коэффициенты матрицы (9) W определяют масштабные коэффициенты сжатия вдоль координат осей. Остальные элементы матрицы определяют поворот координатных осей. Если поворота координат нет (т.е. все недиагональные элементы матрицы (9) равны нулю), то выражение (13) можно записать в виде

pjt18.wmf (14)

В рассматриваемом случае поворот координатных осей не производится. Изменяется только масштаб вдоль координатных осей. Требуется определить такие коэффициенты сжатия, чтобы в новой системе координат расстояния между объектами множества были минимальны, т.е.

pjt19.wmf (15)

Дальнейшие промежуточные выкладки приводятся только из-за их универсальности использования практически к любому частному методу геометрической постановки задачи, которыми являются большинство используемых на практике методов [4, 6, 7].

Для решения, точнее определенности, наложим в исходных параметрах ограничения на весовые коэффициенты, т.е. положим

pjt20.wmf (16)

или

pjt21.wmf (17)

Ограничение (16) требует, чтобы ω_nn изменялись в пределах от 0 до 1, и их сумма равнялась единице. Ограничение (17) приводит к тому, что объемы пространства, занимаемые классами до и после преобразования равны друг другу.

Все дальнейшие рассуждения поведем для случая (16), которые в общем случае идентичны для случая (17).

Если в выражении (15) поменять порядок суммирования и ввести обозначение

pjt22.wmf (18)

то после преобразований получим

pjt23.wmf

pjt24.wmf (19)

где pjt25.wmf – некоторое дополнительное преобразование, например смещение начала координат или дисперсия.

При решении практических задач распознавания выражение (19) приводят к виду

pjt26.wmf (20)

и решают задачу методом Лагранжа при условии

pjt27.wmf

Вводя множитель Лагранжа l, сводим задачу отыскания условного экстремума к задаче поиска абсолютного экстремума, т.е. к минимизации функции вида

pjt28.wmf

Продифференцировав по wnn и приравняв полученное выражение к нулю, получим систему из n уравнений

pjt29.wmf (21)

Отсюда pjt30.wmf

Подставляя последнее выражение в формулу (20), получим

pjt31.wmf (22)

Окончательно имеем

pjt32.wmf (23)

Анализ выражения (23) позволяет сделать ряд важных выводов. Если дисперсия в значениях некоторого признака n = n₁ эталонов рассматриваемого класса велика, т.е. pjt33.wmf , то этот признак можно исключить из рассмотрения, так как он ничего не дает при распознавании. Этот факт имеет вполне физическое объяснение. Если, например, при распознавании типа подводного объекта (подводной лодки) по акустическому портрету использовать цвет окраски бортов, то значение этого признака имеет такую большую дисперсию, что этот признак можно (и нужно) исключить из рассмотрения.

Наоборот, если у эталонных представителей данного класса значение определенного признака одно и то же, то этот признак имеет существенное значение. Например, у однотипных подводных объектов имеются в частотном пространстве ярко выраженные резонансные составляющие на определенных частотах (внутренние работающие механизмы, винт и др.), которые и используются как наиболее весомые признаки.

Если решать задачу (17), т.е. требовать сохранения объема пространства, то получается задача на условный экстремум:

pjt34.wmf (24)

pjt35.wmf (25)

Вводя множители Лагранжа, получим

pjt36.wmf (26)

Используя выражения (24), получим

pjt37.wmf (27)

Отсюда

pjt38.wmf (28)

или

pjt39.wmf (29)

Из выражения (29) следует, что весовой коэффициент данного признака обратно пропорционален среднеквадратическому значению данного признака, т.е. можно считать, что при большом N сумма pjt40.wmf в выражении (23) и произведение pjt41.wmf в выражении (29) постоянны.

В обоих случаях, определяемых формулами (23) и (29), весовые коэффициенты могут рассматриваться как грубое описание класса. Если классов несколько, то весовые коэффициенты находятся для каждого класса. Общее решающее правило в задачах геометрического распознавания формулируется следующим образом. Пусть даны два класса А1 и А2. Для распознавания принадлежности некоторого объекта р к классу {xm} определяется величина

pjt42.wmf

pjt43.wmf

pjt44.wmf . (30)

Решающее правило функционирования распознающего устройства на основании выражения (30) состоит в следующем:

pjt45.wmf ; если pjt46.wmf ;

pjt47.wmf ; если pjt48.wmf ,

причем в каждой из функций pjt49.wmf коэффициенты ans ищутся применительно к первому или второму множеству эталонов. Метод имеет три модификации: метод потенциальных функций, метод решающих функций, метод дискриминантных функций.

Результаты исследования и их обсуждение

Глобальная идея фактически одна и заключается в следующем. Считается априори, что существуют поверхности условных плотностей распределения вероятностей pjt50.wmf , т.е. вероятностей появления значений признака х при условии, что объект принадлежит классу А_i. Однако сформировать алгоритм, описывающий эту функцию, и запомнить в точном виде довольно затруднительно даже для специализированной электронно-вычислительной машины. Обычно поверхности условных плотностей распределения вероятностей, представляющих многомерную функцию высокого порядка, аппроксимируют какими-нибудь функциями, которые называют решающими, потенциальными или дискриминантными функциями g_i(x). Как правило, аппроксимирующие функции значительно проще в математическом представлении. Причем практически задача заключается не столько в аппроксимации, сколько в методике построения этих функций, если заданы какой-то набор эталонов или обучающая последовательность.

Обычно функции выбираются таким образом, чтобы облегчить процесс их практического получения. Эта постановка задачи характерна для вероятностного распознавания. При детерминированном распознавании задается некоторое количество (а не функций распределения вероятностей) и требуется любой новый объект отнести к определенному классу. Здесь предполагается существование разделительных поверхностей. Аналогичным образом на этом множестве эталонов определяются дискриминантные функции g_i(x). Разделительные поверхности определяются из уравнений

pjt51.wmf (31)

В методе дискриминантных функций выбирают другое выражение (модуль и знак разности)

pjt52.wmf (32)

Если pjt53.wmf положительное, то объект относят к классу i, если отрицательное – к классу j.

В качестве пояснений рассмотрим пример классификации некоторого набора подводных объектов по шумовому портрету. Всего распознается m типов лодок. Каждый тип объекта задан в распознающем устройстве набором эталонов М1, М2, … , Мm. Каждому типу (классу) ставится в соответствие потенциальная функция

pjt54.wmf (33)

где

pjt55.wmf (34)

– потенциал, приписываемый n-му объекту i-го класса.

Функционал (34) графически представим в виде кривой (потенциальной функции). По этой формуле pjt56.wmf – это расстояние от точки с координатами n-го эталона в i-м классе до любой другой рассматриваемой точки. Термин «потенциальная функция» связан базовыми понятиями электрических или гравитационных полей, что весьма удобно, исходя из следующих рассуждений. Если в пространстве эталонов в точках, где размещаются эталоны, разместить электрические заряды (или гравитационные массы), то каждый из зарядов создаст вокруг себя поле с потенциалом

pjt57.wmf (35)

где q – величина заряда; k – коэффициент пропорциональности (вес); R – расстояние от заряда.

pjtak1.wmf

Кривая обучения при исследовании с распознаванием цифр

Если зарядов (эталонов) несколько, в сумме функции (35) дадут какую-то потенциальную поверхность. Рассматриваемая задача известна в литературе. Например, в работе [7] приводятся исследования по распознаванию десяти цифр (0, 1,…, 9) с помощью метода потенциалов. На рисунке представлена кривая обучения, полученная в результате исследований с распознаванием цифр.

В работе [3] приводится методика и ее реализация по распознаванию сорока критериев состояния Мирового океана с помощью оптического сканера, установленного на спутнике. На рисунке по оси абсцисс отложено тело эталонных изображений, предъявленных в процессе обучения. Начиная с М = 13 при значениях Р = 85 % кривая вероятности (или надежности) распознавания идет практически параллельно оси абсцисс. Это явление объясняется тем, что к данному числу предъявлений система уже освоила процесс распознавания.

Вторым объяснением могут быть следующие рассуждения. Пусть распознаванию подлежат два класса (а и b). Имеется набор эталонов, представляющих эти классы. Если речь идет о «полном» представлении, то точки эталонов располагались бы равномерно в пространстве образов. Но это довольно редкий случай. Чаще встречается ситуация, когда в одном участке бывает сгущение точек, а в другом – разрежение. Если сгущение в одной подобласти расположено вблизи разрежения другой, то возможны ошибки в классификации (в точках пересечения областей признаков классов).

Для улучшения процесса распознавания необходимо устранить несколько циклов обучения. Когда оканчивается первый цикл обучения, распознающее устройство вторично обучает на тех же эталонах. При этом появляются ошибки (например, уже описанные) и распознающее устройство доучивается. При повторном обучении увеличивают веса (потенциалы) точек распознанных ошибочно (величина pjt58.wmf в формуле (35)), а число М в той же формуле оставляют неизменным. Циклы обучения повторяются до тех пор, пока распознавание будет полностью правильным. Исследования показали, что если при простейшем алгоритме последовательность эталонов N увеличится с 12 до 21, то вероятность распознавания десяти категорий будет одинакова и равна Р = 85 %. При улучшенном алгоритме распознавания для N = 12 при значениях Р = 86,1 %, а для N = 21 при значениях P = 89,3 %.

Выводы

Рассмотренные методы наиболее перспективны в решении задач распознавания в системах управления, когда субъективный человеческий фактор отсутствует, т.е. решение по результатам предварительной классификации и окончательного распознавания система должна принять полностью самостоятельно, в частности в линиях классификации нейросетевой экспертной системы (на базе традиционных и нечетких нейронных сетей), входящей в состав разрабатываемой авторами широкомасштабной радиогидроакустической системы мониторинга полей источников атмосферы, океана и земной коры [9].

Библиографическая ссылка

Пятакович В.А., Василенко А.М. ПЕРСПЕКТИВЫ И ОГРАНИЧЕНИЯ ИСПОЛЬЗОВАНИЯ ГЕОМЕТРИЧЕСКИХ МЕТОДОВ РАСПОЗНАВАНИЯ АКУСТИЧЕСКИХ ОБРАЗОВ МОРСКИХ ОБЪЕКТОВ ПРИМЕНИТЕЛЬНО К ЗАДАЧЕ УПРАВЛЕНИЯ НЕЙРОСЕТЕВОЙ ЭКСПЕРТНОЙ СИСТЕМОЙ // Фундаментальные исследования. 2017. № 7. С. 65-70;
URL: https://fundamental-research.ru/ru/article/view?id=41586 (дата обращения: 01.07.2025).

Научный журнал
Фундаментальные исследования

ISSN 1812-7339

"Перечень" ВАК

ИФ РИНЦ = 1,984

Библиографическая ссылка

Фундаментальные исследования
Научный журнал | ISSN 1812-7339 | ПИ №77-63397