В связи с этим, при формировании списка информативных признаков для идентификации классификационных правил антенатального прогноза состояния здоровья новорожденного мы исходили из необходимости обеспечения приемлемого качества принимаемого решения при доступности используемых методов и средств для широкого круга служб планирования семьи. Были отобраны: результаты ответов беременных на вопросы анкеты «Оценка пренатальных факторов риска» и данные лабораторных исследований (анализов), характеризующие состояние организма женщины. Поскольку основное предназначение решающих правил - это их применение в составе автоматизированной системы в процессе скрининга, то рассматривались два класса, подлежащих распознаванию: «прогноз рождения здорового ребенка» - «ЗН» (7 и более баллов по шкале Апгар) и «прогноз рождения больного ребенка» - «БН» (менее 7 баллов).
По результатам анкетирования беременной решающие правила антенатального прогноза состояния здоровья новорожденного предлагается синтезировать следующим способом:
1. Анкета беременной модифицируется: от бальной шкалы кодирования ответов пациентки осуществляется переход к двоичному кодированию: «0» - признак отсутствует, «1» - присутствует. Получаем пространство Хаi , где i=1,2...,n, n-количество регистрируемых признаков;
2. На обучающей выборке формируется диагностическая таблица, строками которой являются признаки Хаi, столбцами - исследуемые классы, элементами - частоты наблюдения «единичного» значения у признака Хаi в соответствующих классах - РХаi,ЗН, РХаi,БН;
3. На экзаменационной выборке рассчитывается множество значений «коэффициента классификации по анкете» - {CQCj}k для классов k=«ЗН» и k=«БН» в соответствии с формулой:
(1)
(j - индекс объекта в экзаменационной выборке)
4. Определяется закон распределения Fk(CQCj) и, задавшись точностью и уровнем статистической значимости, строится классификационный интервал dCQCk для каждого класса: dCQCЗН,БН = M0ЗН,БН(CQCj) ± zЗН,БН·σЗН,БН(CQCj), где М0ЗН,БН(), σЗН,БН() - операторы вычисления моды и СКО(CQCj) в классах «ЗН» и «БН», соответственно, zЗН,БН - множитель, определяющий размер классификационного интервала
5. Определяется функция принадлежности как: μ1,ЗН=FЗН(M0{CQCЗН},σ{CQCЗН})*(1-βЗН), если у пациентки j CQCЗН dCQCЗН, и μ1,ЗН = (1-βЗН), в противном случае, и μ1,БН=FБН(M0{CQCБН}, σ{CQCБН})*(1-βБН), если у пациентки j CQCБН dCQCБН, и μ1,БН = βБН, в противном случае, (βЗН,БН - ошибки второго рода применения классификационных правил для классов «ЗН» и «БН», определенные на экзаменационной выборке). В качестве коэффициентов уверенностей КаБН и КаЗН» рассматриваются значения функций принадлежности μ1,ЗН и μ1,БН;
6. Формулируется решающее правило о принадлежности состояния пациентки к классам «ЗН» и «БН» в виде заключения типа: «по результатам анкеты беременной уверенность) в рождения больного ребенка составляет КаБН, уверенность в рождении здорового - КаЗН».
На основе информации амбулаторных исследований предлагаются два метода синтеза решающих правил соотнесения состояния пациентки к классам «ЗН» и «БН»: метод различий функциональных состояний (МРФСос) и метод различий функциональных связей (МРФСвязь).
МЕТОД РАЗЛИЧИЙ ФУНКЦИОНАЛЬНЫХ СОСТОЯНИЙ реализуется в признаковом пространстве, где исследуемые классы, образуемые множеством образов имеют определенные структуры и взаиморасположение. Для построения решающих правил используются «показатели структурной организации признакового пространства» (ПСОПП). Поскольку структура и топология классов в решаемой задаче заранее неизвестна, то предлагается рассматривать следующие ПСОПП:
, , , ,
, , .
Где: Хi - значение регистрируемой i-ой характеристики у пациентки (i=1,...,n), n - количество характеристик, , - среднее значение и дисперсия i-ой характеристики в базовом классе (ЗН).
Для каждой пациентки j на экзаменационной выборке для каждого PSl (l=1...7) определяется вектор весовых коэффициентов Ali (в диапазоне [0,1]) включения признака в вычисление интегрального показателя Plj по формуле:
Весовые коэффициенты вычисляются автоматически, достигая минимума ошибки классификации по показателю Pl. Выбирается ПСОПП, у которого указанная ошибка минимальна и фиксируется ему соответствующий вектор Al.
Метод различий функциональных состояний (МРФСос) включает в себя:
ЭТАП ОБУЧЕНИЯ. По медицинским картам беременных формируются репрезентативные обучающая и экзаменационная выборки, подчиняющиеся одному закону распределения и без артефактов. На обучающей выборке рассчитываются значения показателей PSl в каждом диагностируемом классе и определяются параметры Аli в формуле (2), обеспечивающие минимум ошибки классификации. На экзаменационной выборке рассчитываются Pl для каждой беременной, восстанавливаются законы распределения Pl и отбираются те из Pl, которые позволяют наилучшим образом идентифицировать классы «ЗН» и «БН». На экзаменационной выборке строятся классификационные диапазоны dPlЗН и dPlБН на носителе Pl и соответствующие им функции уверенности μk2,ЗН(Pl), μk2,БН(Pl) по методике аналогичной получению μ1,ЗН(CQC) и μ1,БН(CQC) Принимается, что коэффициент уверенности в рождении больного ребенка составляет КpsБН=μk2,БН(Pl), уверенность в рождении здорового - КpsЗН =μk2,ЗН(Pl).
ЭТАП ДИАГНОСТИКИ. У обследуемой пациентки регистрируются значения признаков Хi , для которых Ali ≠0 для отобранного на 1 этапе обобщенного показателя Pl; рассчитываются значения соответствующему ему ПСОПП (PSl). Применяется формула (2) и определяются коэффициенты уверенности. Формулируется решающее правило о принадлежности состояния пациентки к «ЗН» и «БН» вида: «по результатам амбулаторных анализов уверенность согласно МРФСос в рождении больного ребенка составляет КpsБН, в рождении здорового - КpsЗН».
Метод различий функциональных связей (МРФСвязь)
Реализация ЭТАПА ОБУЧЕНИЯ в данном случае осуществляется по следующему алгоритму.
- Формируются обучающая и экзаменационная выборки диагностируемых классов Klfs , подчиняющиеся одному закону распределения и не имеющие артефактов;
- Выбирается класс опорных функций Fop.;
- Выбирается программный инструментарий идентификации опорных функций;
- Задаются критерии отбора наиболее предпочтительных для использования в диагностическом процессе функций из Fop ;
- На обучающей выборке для каждого Klfs формируются подмножества опорных функций, наиболее предпочтительных по критерию минимума ошибки классификации. Количество подмножеств определяется исследователем и рекомендуется в пределах от 3 до 7;
- На экзаменационной выборке рассчитываются значения классификационного коэффициента - формула (3) для каждого подмножества опорных функций.
K1,l = 1-(1-sech(3π*sl/∑sl))℮*(1-sech(3π*vl/∑vl))℮/4 (3)
где sech() - функция гиперболического секанса, s, v - соответственно мода и коэффициент вариации множества квадратов относительных отклонений реальных значений регистрируемых характеристик от соответствующих им значений аппроксимирующих функций; l - индекс класса. Суммирование производится по количеству классов.
7. На экзаменационной выборке для каждого подмножества опорных функций и классификационных коэффициентов определяются величины δКml (m=1,2,3) по формуле (4).
8. Строятся функции принадлежности к исследуемым классам на носителе δКml аналогично методу различий функциональных состояний - μk3,ЗН(δК), μk3,БН(δК). В качестве классификационных интервалов для решающих правил рассматриваются диапазоны [δКpl,+∞), где δКpl - пороговое значение (определяется эмпирически на экзаменационной выборке). Принимается, что коэффициент уверенности в рождении больного ребенка составляет КсБН=μk3,БН(δКl), уверенность в рождении здорового - КсЗН=μk3,ЗН(δКl).
9. Осуществляется селекция лучших подмножеств опорных функций и классификационных коэффициентов для каждого класса по ошибкам классификации второго рода. Выбранные подмножества образуют опорные функциональные пространства для решающих правил. Если желаемого качества классификации достичь не удается, то переходим к п.2.
ЭТАП ДИАГНОСТИКИ осуществляется следующим образом: у пациентки регистрируются значения признаков, вошедших в качестве аргументов в модели опорных функциональных пространств, построенных на этапе обучения. По этим значениям вычисляются величины δК для каждого класса по выбранному(ым) в процессе обучения классификационному коэффициенту (формулы (3)-(6)), полученные на этапе обучения и им соответствующие значения коэффициентов уверенности КсЗН и КсБН). Решающее правила соотнесения пациентки к классам «ЗН» и «БН» формулируются в данном случае следующим образом: «по результатам амбулаторных анализов по МРФСвязь уверенность (риск) в рождении больного ребенка составляет КсБН, уверенность в рождении здорового - КсЗН».
При анализе медицинских карт пациенток женских консультаций выявлено увеличение сложности графа, моделирующего парные связи между регистрируемыми показателями состояния беременной в классе «БН» по сравнению с «ЗН». Это вызвано, на наш взгляд тем, что происходящие в организме матери и плода изменения, приводящие к рождению больного ребенка, вызывают необходимость подключения более жестких адаптационных механизмов, что приводит к росту детерминированных связей между физиологическими системами и отражается в увеличении количества математических моделей последних.