Улучшение результатов лечения тяжелого острого панкреатита можно достичь путем совершенствования объективизации тяжести состояния пациента. Оптимальным путем решения этой проблемы является анализ стратификационных рисков. Наиболее простой и эффективный метод стратификации - это изучение внутри группы относительной гомогенности подгрупп, используя переменную сильно зависимую от исхода (шкалы оценки тяжести состояния) [6]. Разнообразие имеющихся в настоящее время подходов к выполнению этого задания свидетельствует об отсутствии оптимального варианта ее решения. В существующих зарубежных и отечественных клинических рекомендациях по лечению острого панкреатита эти задачи решаются на основе оценки маркеров воспаления и формализованных балльных оценочных систем (Ranson, APACHE II, SOFA) [3, 7, 9]. Однако существующие шкалы оценки тяжести (ОТС) состояния неплохо предсказывают групповой прогноз, но не всегда точны при индивидуальном использовании [2, 4].
В последние годы для преодоления данного ограничения стали использоваться интеллектуальные системы ОТС на основе искусственных нейронных сетей (ИНС) [2, 6]. Общей чертой, присущей всем нейронным сетям, является принцип параллельной обработки сигналов, который достигается путем объединения большого числа нейронов в так называемые слои и соединения определенным образом нейронов различных слоев, а также, в некоторых конфигурациях, и нейронов одного слоя между собой, причем обработка взаимодействия всех нейронов ведется послойно [1].
Принципиальная возможность использования ИНС для оценки тяжести состояния больных острым панкреатитом в настоящее время не подлежит сомнению [2, 6].
В то же время не ясны границы возможностей данной методологии в конкретных клинических ситуациях.
Целью нашей работы являлось сравнительная оценка потенциальных возможностей методики искусственных нейронных сетей и шкал оценки тяжести состояния в определении тяжести, прогнозировании течения и исходов тяжелого острого панкреатита.
Материал и методы исследования
Дизайн исследования - ретроспективное, обсервационное, одноцентровое.
Нами была создана компьютерная база данных из числа госпитализированных в отделение интенсивной терапии (ОИТ) больницы скорой медицинской помощи г. Уфы пациентов с диагнозом острый панкреатит за период с февраля 2004 по февраль 2010 года. Из данного массива были отобраны больные с документированным эпизодом тяжелого острого панкреатита (ТОП) по критериям классификации Atlanta (1992) [5], которым в первые 48 часов госпитализации была произведена абдоминальная ультрасонография и/или компьютерная томография с оценкой пациента по критериям Balthazar [4]. Критериями исключения - возраст менее 18 или более 80 лет; острый панкреатит, обусловленный травмой или опухолью; клинические, радиологические или эндоскопические доказательства хронического панкреатита. Конечные точки исследования - гибель пациента, длительность течения органной дисфункции, развитие абдоминального сепсиса.
Всего в клинику поступили 767 больных, критериям включения соответствовали 105, критериям исключения 5. В разработку было включено 100 пациентов. Среди пациентов, включенных в исследование, было 39 женщин и 61 мужчина; средний возраст составил 48,4 ± 13,9 лет, разброс 18-79 лет. Этиологическими факторами были острого панкреатита: желчные камни у 43 пациентов, алкоголизм у 31 пациента, другие факторы у 26 пациентов. Все они были пролечены по стандартному протоколу клиники и прослежены до момента выписки из стационара. Погибли 28 больных. Мы определили наличие органной дисфункции (ОД) согласно классификации Atlanta (1992) [5], при этом у 57 пациентов органная дисфункция развилась в первые 48 часов госпитализации. У остальных больных (n = 43) органной дисфункции либо не было, либо она развилась после 48 часов нахождения в стационаре. Органная дисфункция была определена как транзиторная, если присутствовала менее трех суток; при длительности ее течения более трех суток она идентифицировалась как персистентная. Персистентная дисфункция одного или более органа/системы развилась у 37 пациентов с тяжелым острым панкреатитом, транзиторная ОД у 63.
Для построения искусственной нейронной сети нами были выбраны на основе ранее опубликованных исследований и собственного клинического опыта тридцать три параметра по 5 категориям (демографические данные, физиологические переменные, лабораторные тесты, временные переменные, исходы заболевания). Для записи в нейронные сети непрерывные величины были переведены в 5-бальную шкалу (0,0; 0,25; 0,5; 0,75; 1,0), где 0,0 баллов означало нормальный результат, а более высокие или низкие результаты были закодированы в виде прогрессивно возрастающего отклонения (положительного или отрицательного, соответственно) от нормальных величин. Впоследствии количество возможных входных данных было уменьшено путем пошагового логистического регрессионного анализа до 6, в зависимости от моделируемого исхода. Это было сделано для того, чтобы число выбранных переменных не было избыточным [1]. Непрерывная величина, длительность госпитализации, измеренная в днях госпитализации, была переведена в биномиальную величину (больше или меньше определенного срока) процедурой определения точки разделения. Мерой служила медиана длительности госпитализации, которая составила для острого деструктивного панкреатита 35 суток (от 23 до 58). Пациенты с длительностью госпитализации большей, чем медиана времени пребывания в стационаре, были отнесены в группу положительных случаев, тогда как пациенты с длительностью госпитализации меньшей, чем медиана времени, были отнесены в группу отрицательных случаев.
С использованием входных данных стандартные трехслойные персептроны были построены для диагностики осложнений и прогнозирования исходов. Каждый из скрытых и выходных нейронов соединен со всеми элементами предыдущего слоя. При использовании сети во входные элементы подавались значения входных переменных, затем последовательно обрабатывались нейроны промежуточных и выходного слоев. Выходные данные нейронных сетей были ранжированы в диапазоне от 0,0 до 1,0, с наибольшей ценностью, соответствующей наивысшему отношению вероятностей положительного исхода. Нейронные сети были обучены и протестированы на всех случаях из базы данных с использованием алгоритма обратного распространения ошибки. Нейронные сети были снабжены входными случаями в паре с исходами для каждого обучающего случая, и весовые значения сети были обновлены после каждого случая. Изначально весовым соединениям были случайным образом присвоены значения от 0,0 до 1,0, в последующем нейронные сети модифицировали величины связей для минимизации среднеквадратичной ошибки между фактическими исходами и сетевыми данными. Параметры нейронных сетей, такие как крутизна сигмоиды, скорость обучения, число обучающих повторений, константы момента, и число скрытых откликов были выбраны эмпирически. Обучение нейронных сетей было остановлено, когда индекс площади под кривой операционных характеристик был максимальным для всех случаев.
Баллы систем оценки тяжести состояния APACHE II, LODS, MODS, SOFA были вычислены при госпитализации, через 24 и 48 часов лечения; баллы Ranson были вычислены однократно через 48 часов. Риск развития сепсиса определялся по шкале RISSC. Исследование уровня прокальциотонина плазмы крови (ПКТ-тест) проводили полуколичественным экспресс-методом диагностическими наборами PCT-Q test (BRAHMS Diagnostica GmbH, Berlin, Germany).
Распределения пациентов по категориям представлены как абсолютная/относительная частота и сравнены с помощью χ2-теста с поправкой Yates или точного φ-теста Fisher. Критическое значение двустороннего уровня значимости р принимали равным 5 %. Относительную силу взаимосвязи между предикторами и исходами болезни определяли как отношение рисков (ОР) с помощью логистического регрессионного анализа, при 95 %-м доверительном интервале ≠ 1,0 отношения рисков между группами пациентов были признаны статистически достоверными. Эффективность систем прогнозирования оценивали на основе определения их дискриминационной способности путем вычисления площади под кривой операционных характеристик (AUC ROC). Для статистического анализа использовали компьютерную программу MedCalc (MedCalc Software, Belgium) и сетевую программу NN PRO (Pro-356, Россия).
Результаты исследования и их обсуждение
Для оценки возможностей ранней идентификации пациентов угрожаемых по развитию тяжелого острого панкреатита мы сопоставили возможности оценочных систем Ranson, Glasgow, ТФС, APACHE II, критериям УЗИ/КТ и нейронной сети на основе определения дискриминации между положительными и отрицательными случаями предсказания ТОП (табл. 1). Исходя из ее содержания можно полагать, что оптимальную презентацию разделения положительных и отрицательных случаев прогноза ТОП продемонстрировало применение модели искусственной нейронной сети.
Таблица 1
Распределения выходных данных для предсказания случаев ТОП по шкалам Ranson, Glasgow, ТФС, APACHE II, критериям УЗИ/КТ и нейронной сети
Оцениваемая система |
Критерий χ² |
р |
Ranson |
0,16 |
0,9223 |
Glasgow |
2,45 |
0,2938 |
ТФС |
0,41 |
0,8135 |
APACHE II |
0,61 |
0,7363 |
Критерии УЗИ/КТ |
15,36 |
0,0015 |
Нейронная сеть |
31.15 |
0,0001 |
Дискриминационная способность исследуемых систем оценки тяжести заболевания определялась путем измерения площади под характеристической кривой. Средняя ее величина для ИНС была равной (AUC = 0,83 ± 0,04) и была представлена статистически значимо лучше других анализируемых оцениваемых систем (р < 0,001). Нами выявлено, что дискриминационная способность шкалы Ranson составила - 0,55 ± 0,06, шкалы Glasgow - 0,58 ± 0,06, шкалы ТФС - 0,53 ± 0,06, шкалы APACHE II - 0,58 ± 0,06 и критериев УЗИ/КТ - 0,68 ± 0,06. Полученные данные дают основание для заключения о том, что ИНС позволяет лучше, чем шкалы ОТС, выявлять пациентов с потенциально неблагоприятным течением заболевания.
При исследовании предсказания риска развития летального исхода нами выявлено, что средняя величина индекса площади под ROC-кривой для ИНС равнялась 0,83 ± 0,04. Дискриминационную способность ИНС сравнивали со шкалами Ranson (AUC = 0,55 ± 0,06), Глазго (AUC = 0,58 ± 0,06), ТФС (AUC = 0,53 ± 0,06), APACHE II (AUC = 0,58 ± 0,06), SOFA (AUC = 0,72 ± 0,05) и критериев УЗИ/КТ (AUC = 0,68 ± 0,06). Информационная ценность ИНС оказалась достоверно выше всех анализируемых нами оценочных систем (р < 0,001 для шкал Ranson, Глазго, ТФС, APACHE II), (р = 0,033 для критериев УЗИ/КТ), (р = 0,046 для шкалы SOFA). Хотя необходимо отметить, что достоверность различий между ИНС и шкалой SOFA требует дополнительного подтверждения с использованием более обширной базы данных.
Ранее ИНС уже использовали для оценки тяжести острого панкреатита по продолжительности госпитального лечения [7, 8] и по развитию локальных и системных осложнений [4]. По данным Keogan M.T. et al.,ИНС достигла чувствительности в 100 % (были определены все тяжелые случаи), но с низкой специфичностью в 29 % и положительной прогностической ценностью теста в 41 % [7]. В нашем исследовании при чувствительности в 81 % (цена восьми упущенных тяжелых случаев) специфичность достигала 70 %, а положительная прогностическая ценность теста - 73 %, и такое повышение оказалось статистически значимым (р = 0,0011).
Известно, что ранняя персистентная органная дисфункция является независимым предиктором неблагоприятного исхода острого панкреатита [9, 10]. При анализе способности ИНС предсказывать продолжительность течения синдрома мультиорганной дисфункции нами отмечено, что чувствительность, специфичность, положительная и отрицательная предсказательные ценности нейронной сети были выше, чем у систем Ranson, APACHE II, LODS и SOFA. Она продемонстрировала наибольшую способность к корректной стратификации пациентов по риску развития персистентной ОД (табл. 2).
Положительный прогноз, определенный нейронной сетью, подтвердился более чем в половине случаев в группах пациентов неопределенного риска развития персистентной ОД по системам Ranson и APACHE II, что позволило достоверно определить риски развития осложнений у данных пациентов. В случае систем LODS и MODS чувствительность нейронной сети составила около или менее половины случаев персистентной ОД и недостоверное отношение рисков (табл. 3).
Средняя величина индекса площади под ROC кривой была наибольшей для нейронной сети со статистически значимой разницей по сравнению с критериями Ranson , шкалами APACHE II , LODS и MODS, но не шкалой SOFA. Площадей под кривой операционных характеристик составили для нейронной сети: AUC = 0,874 ± 0,040 (р = 1,000); критериев Ranson: AUC = 0,737 ± 0,054 (р = 0,014); шкалы APACHE II: AUC = 0,704 ± 0,056 (р = 0,001); шкалы LODS: AUC = 0,742 ± 0,053 (р = 0,022), шкалы MODS: AUC = 0,746 ± 0,053 (р = 0,021) и шкалы SOFA: AUC = 0,766 ± 0,052 (р = 0,077). В скобках указаны уровни достоверности разницы между индексами площади под кривыми по сравнению с нейронной сетью. Таким образом, искусственная нейронная сеть продемонстрировала свою значимость в прогнозировании случаев персистентной ОД. Прежде всего, это высокая положительная и отрицательная прогностическая ценность (96 и 83 %, соответственно), а также дискриминационная способность (AUC = 0,87), превышающие возможности многих общепринятых формализованных систем оценки тяжести состояния и она показала способность прогнозировать течение заболевания в группе пациентов, у которых риск развития персистентной ОД был определен не более чем случайность. В то же время ее дискриминационная способность не превышала возможностей шкалы SOFA.
В целом наше исследование подтвердило предыдущие данные о том, что длительность течения органной дисфункции в ранней фазе острого панкреатита является сильным предиктором последующего неблагоприятного исхода [10].
Таблица 2
Операционные характеристики нейронной сети, систем Ranson, APACHE II, LODS, MODS, SOFA в прогнозировании случаев персистентной органной дисфункции
Чувствительность, %1 |
Специфичность, %2 |
ППЦ, %3 |
ОПЦ, %4 |
Эффективность, %5 |
|
ИНС |
64,9 |
98,4 |
96,0 |
82,7 |
86,0 |
Ranson |
43,2 |
93,7 |
80,0 |
73,7 |
75,0 |
APACHE II |
35,1 а |
92,1 |
72,2 |
70,7 |
71,0 г |
LODS |
59,5 |
84,1 б |
68,7 |
77,9 |
75,0 |
MODS |
70,3 |
71,4 в |
59,1 |
80,4 |
71,0 г |
SOFA |
54,1 |
96,8 |
90,9 |
78,2 |
81,0 |
Примечания:
1 доля истинно-положительных прогнозов среди пациентов с персистентной ОД; 2 доля истинно-отрицательных прогнозов среди пациентов контрольной группы; 3 положительная предсказательная ценность, доля истинно-положительных прогнозов среди всех положительных прогнозов; 4 отрицательная предсказательная ценность, доля истинно-отрицательных прогнозов среди всех отрицательных прогнозов; 5 доля истинно-положительных и истинно-отрицательных прогнозов среди всех пациентов. Оптимальные точки разделения чувствительности и специфичности соответствовали наивысшим значениям прогностической эффективности.
ИНС - искусственная нейронная сеть.
а χ2 = 5,43; р = 0,020; б χ2 = 6,38; р = 0,012; в χ2 = 15,87; р = 0,001; г χ2 = 5,81; р = 0,016 по сравнению с ИНС.
Таблица 3
Чувствительность ИНС в прогнозировании персистентной органной дисфункции среди пациентов, не классифицированных шкалами ОТС
Группа неопределенного риска |
Превалирование персистентной |
Чувствительность |
ОР** (ДИ) |
р |
Ranson 3‒4 балла |
37,9 % (11/29) |
54,5 % (6/11) |
3,77 (1,65-8,63) |
0,005 |
APACHE II 8‒15 баллов |
35,0 % (7/20) |
57,1 % (4/7) |
4,00 (1,33-12,05) |
0,031 |
LODS 2‒5 баллов |
52,4 % (11/21) |
54,5 % (6/11) |
2,40 (1,12-5,16) |
0,064 |
MODS 3‒5 баллов |
50,0 % (9/18) |
44,4 % (4/9) |
2,08 (0,92-4,70) |
0,294 |
Примечание. * - в скобках указаны пропорции пациентов, ** - отношение рисков развития персистентной органной дисфункции при положительном прогнозе ИНС сети было статистически значимо высоким для систем Ranson и APACHE II. ОД, органная дисфункция; ОР, отношение рисков; ДИ, 95 %-й доверительный интервал.
Кроме того, нейронная сеть, сконструированная из вышеназванных клинико-биохимических и визуальных критериев, обученная и протестированная по стандартному протоколу, показала самую высокую дискриминационную способность в прогнозировании случаев абдоминального сепсиса среди пациентов с острым деструктивным панкреатитом: разница между индексами площадей под кривыми операционных характеристик была статистически достоверной по сравнению со всеми моделями сравнения: по модели нейронной сети (AUC = 0,79 ± 0,04; р = 1,000), шкалам SOFA (AUC = 0,66 ± 0,05; р = 0,032), APACHE II (AUC = 0,67 ± 0,05; р = 0,036) и специально сконструированной в последние годы оценочной системой прогноза развития тяжелого сепсиса RISSC (AUC = 0,60 ± 0,06; р = 0,001), визуальным критериям УЗИ/КТ (AUC = 0,65 ± 0,05; р = 0,032). При чувствительности в 63,3 % искусственная нейронная сеть продемонстрировала самую высокую специфичность в 88,2 % среди сравниваемых прогностических моделей, разница была статистически значимой по сравнению со шкалами APACHE II, RISSC и критериями УЗИ/КТ (р < 0,05; р < 0,01 и р < 0,01 соответственно). Вероятность правильной диагностики абдоминального сепсиса, корригированная на превалирование абдоминального сепсиса в популяции исследованных пациентов (в данном случае 49 %), составила для нейронной сети 83,8 %, что выше аналогичного показателя для шкал SOFA, APACHE II, RISSC и критериев УЗИ/КТ.
Проведенное нами исследование показало, что дискриминационная способность искусственных нейронных систем относительно прогноза гнойно-септических осложнений острого панкреатита достоверно выше, чем у шкал APACHE II, RISSC и визуализационных методик. Таким образом, представленные результаты дают возможность заключить, что методология искусственных нейронных сетей позволяет с высокой эффективностью прогнозировать развитие абдоминального сепсиса у больных с тяжелым острым панкреатитом.
В нашем исследовании сеть, составленная только из шести входных данных, была представлена достоверно лучше, нежели шкалы Ranson, Глазго, ТФС и APACHE II.и SOFA практически по всем позициям. Превосходство нейросетевого подхода проявилось в наилучшей способности различать тяжелые случаи острого панкреатита, но не в прогнозировании менее тяжелых случаев. Нами не выявлено преимуществ нейросетевого подхода в предсказании характера течения синдромов органной дисфункции. Статистически значимые, но минимальные различия обнаружены нами в способности оценивать риск развития летального исхода относительно шкалы SOFA. Проведенное нами исследование подтвердило возможность использования методологии ИНС в оценке тяжести состояния и прогнозе характера течения острого панкреатита. В то же время необходимо отметить, что статистически наиболее значимым является способность данной прогностической системы к ранней идентификации групп пациентов угрожаемых по развитию тяжелого острого панкреатита и абдоминального сепсиса.
Выводы
1. Предективная способность методики искусственных нейронных сетей в ранней идентификации группы пациентов угрожаемых по развитию тяжелого острого панкреатита существенно превосходит возможности оценочных систем (Ranson, Glasgow, ТФС, APACHE II, критериев Balthazar).
2. Дискриминационная способность искусственных нейронных сетей в оценке риска развития летального исхода у больных острым деструктивным панкреатитом достоверно выше, чем у шкал Ranson, Glasgow, ТФС, APACHE II, SOFA и критериев Balthazar.
3. При прогнозировании длительности течения синдромов органной дисфункции у больных острым деструктивным панкреатитом информационная ценность искусственных нейронных сетей и шкалы SOFA сопоставима.
Рецензенты:
Валишин Д.А., д.м.н., профессор, зав. кафедрой инфекционных болезней с курсом дерматовенерологии института последипломного образования Башкирского государственного медицинского университета, г. Уфа;
Габдулхаков Р.М., д.м.н., профессор кафедры анестезиологии и реаниматологии с курсом института последипломного образования Башкирского государственного медицинского университета, г. Уфа;
Кечеруков А.И., д.м.н., профессор, зав. кафедрой общей хирургии ГОУ ВПО «Тюменская государственная медицинская академия», г. Тюмень.
Работа поступила в редакцию 19.07.2011.