Scientific journal
Fundamental research
ISSN 1812-7339
"Перечень" ВАК
ИФ РИНЦ = 1,674

METHODOLOGICAL ASPECTS OF DIAGNOSING THE STATE OF MULTI-DIMENSIONAL OBJECTS

Lomakina L.S. 1 Soloveva I.V. 2 Zelentsov S.A. 1
1 Nizhny Novgorod State Technical University R.E. Alekseev
2 Federal Budget Institution of Science «Nizhny Novgorod Scientific and Research Institute of Epidemiology and Microbiology named after academician I.N. Blochina» Of Federal Service on Surveillance for Consumer Rights Protection and Human Welfare
The article analyzes the existing intelligent methods of diagnosing multi-dimensional objects. Multidimensional objects are characterized by a large number of components and subsystems that are in continuous relationship and interaction with each other and with the environment. The complexity of multi-dimensional objects imposes certain features of the processes of analysis and synthesis of diagnosis. Among the intellectual approaches to diagnosis multi-dimensional objects by a process of learning can be divided into two main areas: the education system with deductive and inductive learning system. Deductive learning involves the formalization of expert knowledge and their transfer to the computer as a knowledge base. Deductive systems include expert systems for various purposes. Inductive learning systems based on detecting patterns in empirical data. The inductive approach includes the methodology of neural networks and genetic algorithms. Biocenosis of the gastrointestinal tract of a human considered as an example of multi-dimensional objects. Based on the analysis of existing intelligent diagnostic systems deficiencies and particularities of their application to multidimensional objects have been identified.
diagnostics
multi-dimensional objects
deductive learning
inductive learning
classification
biocenosis
1. Dzharratano D., Rayli G. Ekspertnye sistemy. Printsipy razrabotki i programmirovanie [Expert systems. Principles of design and programming]. Moscow, Vilyams, 2007. 1152 p.
2. Lomakina L.S., Soloveva I.V., Zelentsov S.A., Pozhidaeva A.S. Nauchno-tekhnicheskiy vestnik Povolzhya, 2013, no. 5. pp. 251–255.
3. Lomakina L.S., Zelentsov S.A. Sistemy upravleniya i informatsionnye tekhnologii, 2015, no. 1(59), pp. 68–73.
4. Osuga, S. Obrabotka znaniy [Processing expertise]. Moscow, Mir, 1989. 293 p.
5. Rutkovskaya D., Pilinskiy M., Rutkovskiy L. Neyronnye seti, geneticheskie algiritmy i nechetkie sistemy [Neural networks, genetic algiritmy and fuzzy systems]. Moscow, Goryachaya liniya – Telekom, 2007. 452 p.
6. Rybina G.V. Teoriya i tekhnologiya postroeniya integrirovannykh ekspertnykh system [The theory and technology of building integrated expert systems]. Moscow, Nauchtekhlitizdat, 2008. 482 p.
7. Rybina G.V., Parondzhanov S.S. Tekhnologiya postroeniya dinamicheskikh intellektualnykh sistem [Technology building dynamic intellectual systems]. Moscow, NIYaU MIFI, 2011. 238 p.

В природе практически все объекты (физические, биологические, технические, социальные) описываются множеством физических величин или параметров (переменных), которые в совокупности образуют модель объекта как структурированный состав, т.е. систему.

Анализ свойств модели на основе системного подхода и экспериментальная проверка результатов анализа являются основной целью современных научных исследований. Объект (образец) обнаруживает себя вовне как совокупность наблюдаемых переменных, значения которых интерпретируются как свойства объекта, его состояния.

Таким образом, состояние объекта описывается значениями измеряемых переменных ξ = (ξ1, ξ2, …, ξn), последовательность которых можно рассматривать как вектор в n-мерном евклидовом пространстве, пространстве переменных. В литературе переменные часто называют компонентами, поскольку в совокупности они образуют систему – модель объекта. Обнаружить структурные закономерности (свойства) системы, т.е. различного рода зависимости между компонентами, по единственному состоянию системы не представляется возможным, поскольку зависимость отражает характер совместного изменения значений переменных. Для решения поставленной задачи необходимо располагать по крайней мере множеством состояний, каждое из которых изображается точкой в n-мерном пространстве переменных.

Интеллектуальные методы в системах диагностирования многомерных структур

Среди интеллектуальных подходов при диагностировании многомерных объектов по способу обучения можно выделить два основных направления: системы с дедуктивным обучением и системы с индуктивным обучением.

Дедуктивное обучение предполагает формализацию знаний экспертов и их перенос в компьютер в виде базы знаний. К дедуктивным системам относят экспертные системы (ЭС) различного назначения. В общем случае они состоят из базы знаний (БЗ), механизма вывода и интерфейса, обеспечивающего связь пользователя и эксперта с системой.

Системы индуктивного обучения основываются на выявлении закономерностей в эмпирических данных. К индуктивным подходам относят методологию нейронных сетей (НС) и генетических алгоритмов (ГА) [5].

Системы с дедуктивным обучением

Экспертные системы

В экспертных системах решение об отнесении объекта, характеризующегося диагностическими признаками, к определенному классу производится на основе выявления соответствующего правила в базе знаний. Правила могут представлять собой классические импликации вида «если – то» или быть представлены в виде семантических сетей или фреймов. В продукционных моделях в качестве антецедента (условия) выступают классифицируемые параметры, по которым производится поиск в базе знаний. Консеквентом (выводом), соответственно, выступают диагностические заключения.

При разработке ЭС инженеры знаний стремятся получить знания главных экспертов в таких выражениях, которые могут быть оценены как правила. Одно из таких правил помещается в базу правил. Текущее рабочее знание и база правил будут оценены снова правилами организации цепочек для получения заключения [1].

Нечеткая логика

Системы с нечеткой логикой также относятся к классу систем, основанных на знаниях. Основным отличием от ЭС является то, что в процессе функционирования они оперируют с нечеткими величинами, выраженными в лингвистических переменных, и принятие решений происходит с помощью средств «мягких» вычислений.

Методология систем с логическим выводом значительно упрощена. Заданные варианты и границы проверяются на предмет попадания в область и, в зависимости от результата, выбирается действие. Подход дает возможность связать множество утверждений вместе, чтобы сформулировать более сложные умозаключения. Такая технология, как таблица решений, может быть применена, чтобы обеспечить простоту анализа представлений этих утверждений.

В контексте задач классификации состояний многомерных объектов по диагностическим параметрам нечеткой логики ранжируют данные по степени близости к центру класса на основе построения нечетких функций принадлежности [6].

Системы с индуктивным обучением

Генетические алгоритмы

Генетические алгоритмы представляют собой эволюционные методы принятия решений, основанные на механизмах естественного отбора и наследования. Чаще используются в качестве метода оптимизации. Отличительной особенностью генетических алгоритмов является кодирование параметров, операции на популяциях, использование целевой функции для поиска наиболее подходящего решения, применение вероятностных правил выбора [7]. Для использования генетических алгоритмов необходимо большое множество компонентов, чтобы решить проблему.

Нейронные сети

В нейронных сетях решающее правило представляет собой функции активации нейронов. Принципы обучения и самообучения, положенные в основу нейронных сетей, позволяет системе обучаться на прошлом опыте и примерах, а также распознавать известные примеры в клинической информации.

В нейронных сетях выделяют три главных уровня: входы (приемник данных или полученные данные), выводы (объединенные результаты или возможные состояния) и скрытый слой (обрабатываемые данные). Система становится более эффективной с известными результатами для больших массивов данных [4].

Таблица 1

Нейронные сети в аспекте решения задач диагностики многомерных объектов

Тип сети

Достоинства

Недостатки

Многослойный линейный персептрон

Широко распространены, для их реализации разработано множество прикладных пакетов

Экспериментальное определение количества скрытых слоев

Радиальнобазисная сеть

Имеют один скрытый слой, реализующий нелинейную функцию

Сложности с интерпретацией результатов

Вероятностная сеть

Имеют скрытый слой, реализующий нелинейную функцию; позволяют получать результат в виде оценок вероятностей

Для получения более точных результатов необходимо иметь оценки априорных вероятностей

Сеть Кохонена

Способность классифицировать новые, ранее неизвестные данные на основе алгоритмов самообучения

Невозможно проследить ход получения вывода

Сеть Хопфилда

Однослойность. Быстрое и простое обучение за один цикл. Способность восстанавливать целый образ по части

Ограниченное количество запоминаемых образов

Основываясь на результатах анализа нейронных сетей в аспекте решения задач диагностики многомерных объектов (табл. 1), можно сделать вывод, что для экспериментального определения параметров точности нейросетевого классификатора необходимо рассмотреть следующие нейронные сети:

● вероятностная нейронная сеть, поскольку такая сеть позволяет получать результаты классификации в виде вероятностных оценок;

● сеть Хопфилда, так как характеризуется простотой в обучении и способностью восстанавливать целый образ по части.

Сравнительный анализ интеллектуальных методов диагностирования

Обобщенная структура современных систем диагностики многомерных объектов представлена на рисунке.

Интерфейсный модуль служит для обеспечения связи между пользователем (или экспертом) и системой. С помощью этого блока данные поступают в систему для дальнейшей обработки, также модуль интерфейса позволяет пользователю получать результаты работы системы в удобной и понятной для него форме. Системы диагностики обладают базой данных (БД) для хранения информации об объектах. База знаний служит для хранения правил, на основе которых принимается решение. В случае систем с индуктивным обучением БЗ может содержать обучающие данные, представленные в виде прецедентов [2]. База моделей (БМ) содержит математические модели сбора, обработки и хранения данных.

Блок анализа данных представляет собой вычислительную базу системы диагностики. Здесь на основе правил БЗ и математических моделей БМ вырабатывается решение, а также производится пред- и постобработка данных. Затем результаты анализа поступают в блок вывода [3].

pic_59.tif

Обобщенная структура интеллектуальных систем диагностики многомерных объектов

В зависимости от решаемых задач блок анализа данных может иметь различную математическую основу и применять классические методы анализа данных, основанные на статистической обработке, или интеллектуальный анализ данных.

На основе проведенного анализа существующих диагностических систем (табл. 2) были выявлены следующие недостатки: первая группа систем с дедуктивным обучением не поддерживает работу с данными, характеризующимися слабой структурируемостью, неопределенностью, неточностью, нечеткостью и неполнотой; вторая группа систем с дедуктивным обучением не поддерживают получения новых знаний из экспериментальных данных; третья группа систем – системы с индуктивным обучением – имеют слабый интерпретационный механизм, не позволяющий проследить ход решения.

Таблица 2

Сравнительный анализ интеллектуальных методов диагностики

Метод

Особенности

Ограничения

Примеры

Байесовские сети

Знания и заключения экспертов представлены в форме вероятностей

Сложность получения знаний о вероятностях для возможного результата

Iliad

DXPlane

GenRost

Экспертные системы

Предметная область ограничивается только знаниями экспертов и возможностью трансформировать эти знания в четкие правила

Не работают с данными, имеющими пропуски.

Не могут получать новые знания из экспериментальных данных

MYCIN

CADUCEUS

GenRost

DiagnosisPro

Diagnoz-it

ДИАНЕС

Нечеткая логика

Опираются на методологию «мягких» вычислений

Не могут получать новые знания из экспериментальных данных

GenRost

Генетические алгоритмы

Получают информацию из данных пациентов. Принимают итеративную обработку для получения оптимального решения

Сложности в определении функции пригодности решений. Отсутствие интерпретации хода решения

ДИАГЕН

Нейронные сети

Получают информацию из данных пациентов. Поддерживают обучение и самообучение

Отсутствие интерпретации хода решения

VisualDx

RODIA

Классификация состояний биоценоза

В настоящее время актуальным является внедрение информационных технологий в процесс научных и прикладных исследований состояний биоценоза для повышения точности диагностирования. Биоценоз – это системно-организованная совокупность живых организмов, обитающих в определенной среде. Биоценозом также является микробиота желудочно-кишечного тракта (ЖКТ) человека.

Модель, описывающая состояния биоценоза ЖКТ, строится на исходных данных, которые представляют собой результаты бактериологических исследований состояния пищеварительного тракта больных и здоровых людей. Результат исследования состояния ЖКТ отдельного пациента представляется в виде вектора ξ = (ξ1, ξ2, …, ξn) в n-мерном евклидовом пространстве, координатами которого являются скалярные величины, каждая из которых соответствует количеству микроорганизмов определенного вида. Таким образом, математическая модель представляет собой n-мерное пространство признаков, которые априорно разделены на классы, соответствующие диагностируемым классам заболеваний. Таким образом задача классификации состояний биоценозов сводится к задаче диагностирования многомерных объектов и принятия решения, какому из классов принадлежат результаты анализа пациента.

В рамках научного исследования для повышения эффективности объективизации оценок состояния микробиоты ЖКТ человека в Нижегородском научно-исследовательском институте эпидемиологии и микробиологии им. академика И.Н. Блохиной были исследованы возможности применения интеллектуальных методов диагностирования многомерных объектов, основанные на нейронных сетях и диагностических экспертных системах. По результатам экспериментов можно судить о том, что обе модели могут успешно осуществлять диагностирование биоценозов.

Выводы

Проведя анализ систем, основанных на вышеописанных методиках, можно выдвинуть заключение о том, что интеграция систем с дедуктивным обучением с системами с индуктивным обучением может повысить достоверность и обоснованность результатов.

Комбинация методов, с одной стороны, дает возможность использовать индивидуальную силу каждого из методов для решения специфических частей задачи, что позволяет создать более эффективные модели представления и обработки знаний. С другой стороны, такой подход основывается на том, что только синергетическая комбинация интеллектуальных технологий может достичь полного спектра когнитивных и вычислительных возможностей, реализуемых в компьютерных моделях интеллектуальных систем.

Рецензенты:

Соустова И.А., д.ф.-м.н., профессор, ведущий научный сотрудник, Институт прикладной физики РАН, г. Нижний Новгород;

Чиркова М.М., д.т.н., профессор кафедры «Информатика, системы управления и телекоммуникаций», Волжский государственний университет водного транспорта, г. Нижний Новгород.