Scientific journal
Fundamental research
ISSN 1812-7339
"Перечень" ВАК
ИФ РИНЦ = 1,674

INFORMATION AND ANALYTICAL MODEL OF DECISION SUPPORT IN THE STOMACH CANCER DIAGNOSIS

Artemenko M.V. 1 Serebrovskiy V.V. 1 Babkov A.S. 1
1 Southwest State University
1105 KB
The structure of and considered the information-analytical model of synthesis and application of diagnostic decision rules gastric cancer in the screening process based on the analysis of private and integral parameters of blood (including tumor markers). Author’s method of analysis is presented of confidence in accepting adequate diagnostic decisions based on analysis of the differences and functional changes in the classroom, «not with cancer of the stomach» and «ill people». Training samples are confirmed clinically. It is proposed to carry out the calculation of the coefficient of confidence in making decisions based on the following indicators of confidence: confidence in the availability of necessary reprezantivnosti training sample, confidence in the adequacy of identified through self-organization simulation algorithms – the group method of data handling; confidence in the correctness of classification, the estimated values ​​of the errors on the first and second kind. The proposed information-analytical system for early diagnosis of cancer of the stomach during the screening process differs sharing of objective information about the patient’s condition at the stage of pre-clinical examination of the patient in terms of screening of blood analysis and subjective information obtained during the examination of the patient.
gastric cancer
screening
self-organization algorithms for modeling
decision-making confidence
1. Stomach cancer: symptoms, diagnosis, treatment, prevention [electronic resource]. Available at: http://natural-medicine.ru/4127-rak-zheludka.html (accessed 18 February 2014).
2. Shebshaevich L.G., Alekseev A.A. Life – cybernetic biomedical systematic («Human Genome» cloning – a critical analysis). M.: Triad Plus, 2001. рp. 608.
3. Artyomenko M.V., Money A.S. Classification of methods for predicting the behavior of systems // Modern problems of science and education. 2013. no. 6. URL: www.science-education.ru/113-11527 (accessed 18 February 2014).
4. Ivakhnenko A.G. Long-term forecasting and management of complex systems. M.: Technology, 1975. pp. 313.
5. Obolensky A.N., Korenevskii N.A., Artyomenko M.V. Integral use of immune networks and correlation analysis to identify pathologies in electrocardiosignals // Proceedings of the Southwestern State University. Series: Management, Computer Engineering, Computer Science. 2012. Vol. 3, no. 2. pp. 351–356.

В настоящее время актуальна проблема диагностики онкологических заболеваний желудка на ранней стадии. В странах с большим количеством населения территориально отдаленного последних от специализированных центров своевременной диагностики и лечения, диагностика осуществляется, как правило, в процессе скрининга или средств телемедицины [1]. В основе предлагаемого диагностического подхода ранней диагностики рака желудка предлагается применять концепцию рассмотрения крови как соединительной ткани, системно присутствующей во всех участках внутренних и внешних физиологических систем и органов и несущей в значениях регистрируемых характеристик информацию об изменениях в организме [2].

В процессе скрининг-диагностики или общей диспансеризации осуществляется лабораторный анализ крови. Определим их как частные, первично регистрируемые, принадлежащие некоторому множеству {Х}. Для решения задач доклинической диагностики на основе анализа указанных показателей в процессе скрининга предлагается применять следующую информационно-аналитическую модель (рисунок).

На принятие управленческого решения о необходимости проведения клинического обследования на предмет выявления рака желудка оказывают влияние различные факторы: образ жизни (прежде всего характер питания и стрессовость), жалобы пациента и другие показатели функционирования определенных физиологических систем. Эти показатели группируются в блоке «Жалобы больного, образ жизни, наследственность».

Основной группой анализируемых показателей доклинической диагностики возможности наличия онкологических заболеваний желудка являются значения показателей, полученных в процессе анализа крови (включая значения показателей онкомаркеров) – в информационно-аналитической модели представлены блоком «База показателей крови». В этом блоке весь информационный архив показателей лабораторного анализа крови состоит из двух групп. В первую – включены показатели крови людей с клинически подтвержденным диагнозом рака желудка. Вторую группу составляют значения тех же показателей у людей, не больных раком желудка. Таким образом, в базе показателей крови представлены показатели для двух альтернативных классов. Под альтернативным классом будем понимать не больных онкологическими заболеваниями людей – класс w0, больных раком желудка – класс w1.

pic_7.wmf

Информационно-аналитическая модель доклинической диагностики рака желудка

Результаты лабораторного анализа крови людей, по которым решается задача ранней диагностики, представлены «Блоком регистрации текущих показателей крови».

Для построения классификационных правил формируются обучающие выборки, по которым синтезируются правила принятия решений с использованием самоорганизационных алгоритмов, основанных на математических моделях, идентифицированных с помощью программных средств метода группового учета аргументов (МГУА) [3, 4].

Процедура обучения реализуется в «Блоке синтеза моделей взаимосвязей между показателями крови». В качестве исходных данных для этого блока используются как традиционные показатели анализа состава крови (вектор Х = х1, …, хn), так и комплекс интегральных показателей (вектор Y = y1, …, ym). Значения интегральных показателей определяются по формуле вида:

artem46.wmf (1),

где k – индекс интегрального показателя; Yk – интегральный показатель; x– значение i-го частного показателя крови у пациента, artem47.wmf σw0– соответственно, модальное значение (в случае нормального распределения совпадает с математическим ожиданием и средними значениями) и средне-квадратичное отклонение (СКО) i-го частного показателя крови, полученное на обучающей выборке для класса «здоровые», artem48.wmf – весовые коэффициенты, определяющие информационный вклад показателя xi в формирование интегрального показателя Yk.

В предлагаемой информационно-аналитической модели предусмотрено несколько вариантов определения указанных коэффициентов: экспертное; заключение, на основе дисперсионного анализа; использование информационного критерия Кульбака.

Интегральные показатели используются для решения задач ранней диагностики рака желудка и вычисляются для анализируемого пациента в «Блоке расчета интегральных показателей».

Результатом работы «Блока синтеза моделей взаимосвязей между показателями крови» является набор математических моделей, характеризующих множественные связи между векторами признаков artem01.wmf и интегральных показателей artem02.wmf для основного (рак желудка) и альтернативного классов.

В целях оптимизации применения моделей формируется «База моделей системных взаимосвязей».

В «Блоке расчета риска заболевания по самоорганизационным моделям» основного класса заболеваний w1, используя вектора artem03.wmf иartem04.wmf, определяются модифицированные вектора artem05.wmf и artem06.wmf как значения аппроксимантов идентифицированных моделей. Аналогично по моделям альтернативного класса w0, используя те же вектора artem08.wmf и artem09.wmf, определяются вектора artem10.wmf и artem11.wmf. По полученным векторам определяются меры близостей – вектора: artem12.wmf и artem13.wmf соответственно между векторами artem14.wmf, и artem15.wmf и artem16.wmf.

Полученные значения мер близости являются базовыми переменными для решения задачи расчета рисков соотнесения состояния пациента к различным альтернативным классам Rkw0 и Rkw1 в блоке расчета риска заболевания по самоорганизационным моделям.

С целью улучшения качества классификации кроме показателей крови используются значения признаков, формируемых в блоке «Жалобы больного, образ жизни, наследственность». По этой группе признаков в блоке оценки риска заболевания рассчитываются показатели Rtw0 и Rtw1, характеризующиe степени риска возникновения рака желудка (или не возникновения соответственно), значения которого выбираются из «Блока оценки риска заболевания».

Окончательное решение о проведении клинического обследования осуществляется путем агрегации указанных показателей риска в «Блоке принятия решения о клиническом обследовании».

Учитывая факт наличия малых выборок при решении рассматриваемой диагностической задачи, предлагается использовать самоорганизационный алгоритм структурно-параметрической идентификации МГУА, синтезирующий модели вида (2):

artem45.wmf (2)

где Ai – весовой коэффициент; z– переменная (из множеств {X},{Y}); q– степень аргумента; n – количество рядов селекции (термов полинома); m – количество переменных.

Затем в каждом из альтернативных классов формируются наборы адекватных моделей, не пересекающихся друг с другом по параметрам или структурам.

Таким образом, согласно предлагаемой информационно-аналитической модели доклинической диагностики рака желудка предлагается следующая методика классификации:

1. Формируется репрезентативная выборка исходных данных (частные и интегральные показатели крови – множества {X} и {Y} соответственно), на основе которой после селекции артефактной информации осуществляется формирование из нее обучающей и экзаменационной подвыборок.

2. Для каждого диагностируемого альтернативного класса формируются пакеты математических моделей, отражающих связи между показателями соответственно:

artem49.wmf (3)

artem50.wmf (4)

artem51.wmf (5)

artem52.wmf (6)

artem53.wmf (7)

artem54.wmf (8)

где n1 – количество частных показателей; n2 – количество интегральных показателей; F1 – аппроксиманты, построенные на множестве {X}; F2 – аппроксиманты, построенные на множестве {Y}; F3 – аппроксиманты, построенные на множествах {X} и {Y}, Ксm – коэффициенты уверенности в адекватности применения аппроксимантов в качестве моделей (в соответствующих альтернативных классах w0, w1); R2 – коэффициенты детерминации для соответствующих моделей-аппроксимантов.

В пакеты моделей включаются только те, у которых значения коэффициентов детерминации превышает определенный исследователем пороговый уровень.

Уверенность в адекватности применения сформированных пакетов математических моделей в альтернативных классах определяются по формулам (9) и (10) соответственно.

artem17.wmf (9)

artem18.wmf (10)

где Кw0 = n1, Кw1 = n2.

Значение коэффициента уверенности одновременного применения обоих пакетов моделей вычисляется по формуле (11).

artem19.wmf (11)

3. На экзаменационной подвыборке определяется уверенность квалификационных возможностей для каждого альтернативного класса КУквw0 и КУквw1 как (1 - βw0) и (1 - βw1), где βw0, βw1 - ошибки второго рода классификации.

В случае недостаточности объемов экзаменационных подвыборок в каждом из альтернативных классов осуществляется экспертный анализ для построения функции принадлежности на базовой переменной Zb, вычисляемой по формуле (12). Затем значение функции принадлежности используется для вычисления соответствующих значений коэффициентов уверенности:

artem55.wmf (12)

где g1, g2 – некоторые функции, определяющие мерность носителя; artem56.wmf, artem57.wmf – значения частных и интегральных показателей для диагностируемого пациента.

В этом случае функция принадлежности рассматривается в виде формулы:

artem58.wmf (13)

4. Процесс диагностики возможного заболевания раком желудка осуществляется следующим образом.

В ходе осуществления анализа крови формируется экспериментальный вектор (включая значения онкомаркеров) artem20.wmf (размер вектора m1) и характеристики образа жизни – пациента – вектор artem21.wmf. По последнему в блоке определения риска заболевания (рисунок) рассчитывается значение показателя риска Rt (по табличным данным, заранее определенным экспертами с учетом личного опыта и/или рекомендаций научно-практических исследований по данным публикаций). По вектору artem22.wmf рассчитывается вектор экспериментальных интегральных показателей artem23.wmf (размерность вектора m2).

Полученные вектора artem24.wmf и artem25.wmf поступают в «Блок расчета риска заболеваний по самоорганизационным моделям», в котором определяются коэффициенты уверенности КУмw0, КУмw1, КУквw0, КУквw1, КУв. По данным коэффициентам уверенности определяются обобщенные классификационные коэффициенты уверенности соотнесения к альтернативным классам КУw0 и КУw1 – формулы (14) и (15), соответственно.

artem26.wmf (14)

artem27.wmf (15)

Далее, используя формулы (3)–(8), вычисляются для каждого из альтернативных классов множества: artem28.wmf и artem29.wmf соответственно. Затем определяются меры близости по формулам (16) и (17) соответственно.

artem30.wmf (16)

artem31.wmf (17)

По полученным значениям мер и предварительно заданным экспертным путем (клиницистами) функциям принадлежностей к альтернативным классам w0 и w1 (artem32.wmf и artem33.wmf соответственно), определяются показатели уверенности принадлежности к альтернативным классам по мерам близости КУмбw0 и КУмбw1 по формулам (18) и (19) соответственно.

artem34.wmf (18)

artem35.wmf (19)

Примечание. Функции принадлежности рекомендуется строить по формуле (20). (Эксперт определяет численные значения a и b – рекомендуется: a = 0,1 –0,15, b > 0,5)

artem36.wmf (20)

По полученным значениям показателей уверенности определяются показатели риска Rkw0 и Rkw1 по формулам (21) и (22) соответственно:

artem37.wmf (21)

artem38.wmf (22)

Для принятия решения о принадлежности пациента к одному из альтернативных классов в блоке принятия решения о клиническом обследовании осуществляется расчет коэффициентов уверенности в диагностике КУдw0 и КУдw1 по формулам (23) и (24) соответственно.

artem39.wmf (23)

artem40.wmf (24)

Для каждого из показателей уверенности задаются пороговые отношения Pw0 и Pw1 и составляется таблица. Если значение соответствующего показателя не превышает порогового уровня, то значение элемента таблицы равно «0», в противном случае – «1». Каждому соотношению соответствует определенная ситуация.

Диагностические ситуации (р – пороговые значения – определяются экспертно)

artem41.wmf

artem42.wmf

artem43.wmf

artem44.wmf

Идентификатор (№ ) ситуации

Описание ситуации

0

0

0

0

1

Дополнительное обследование

0

0

0

1

2

Здоров – класс w0

0

0

1

0

1

Дополнительное обследование

0

1

0

0

3

Болен – класс w1

1

0

0

0

1

Дополнительное обследование

Таким образом, выделяются 3 ситуации, возникающие в процессе применения предлагаемой информационно-аналитической модели: 1 – пациент нуждается в дополнительном обследовании; 2 – вероятность присутствия рака желудка низка (пациент здоров); 3 – высока вероятность присутствия заболевания рака желудка.

Заметим, что для решения классификационных задач возможного развития заболевания в процессе мониторинга изменений определенных физиологических сигналов, представленных временными рядами и отражающих системные изменения в организме, возможно применение искусственных иммунных сетей (по методике, например, рассмотренной в работе [5]).

Таким образом, предлагаемый метод доклинической диагностики рака желудка, основываясь на самоорганизационных алгоритмах идентификации математических моделей, отличается анализом межсистемных связей между различными показателями крови, несущей информацию о происходящих в организме системных изменениях в процессе возникновения онкологических заболеваний, в первую очередь внутренних органов – в частности рака желудка.