Предсказание предстоящей продолжительности жизни (ППЖ) играет важную роль в современной медицине и биологии. Однако попытки дать индивидуальный прогноз ППЖ, как правило, не оправдываются из-за больших дисперсий даваемых оценок. Поэтому появился целый ряд работ, в которых исследования проводятся на животных, а сам прогноз делается но основании различных индивидуальных маркеров (Altman, Royston 2000, Harperr et al. 2004, Cargill et al. 2003, Clark et al. 2003, Miller 2001, Piantanelli 2001, Stevens et al. 2000, Watari et al. 2002). В 2007 г. Cook et al. предприняли попытку определения реального возраста москитов по генетическим индексам.
Мы сделали прогноз ППЖ для популяции из 1000 плодовых мушек Medfly, основываясь на индивидуальных паттернах яйценесения (Новосельцев с соавт. 2007, 2008). Оказалось, что дисперсия индивидуальных ошибок в прогнозируемых данных сравнима с ошибками «демографического» предсказания ППЖ (под демографическим предсказанием здесь понимается приписывание каждому животному среднепопуляционного времени предстоящей жизни). Так, при прогнозе, осуществленном на 20-й день жизни популяции, среднеквадратическая ошибка предсказания ППЖ оказалась равной sindiv=14.02 («демографичееский» прогноз, sdemogr=13.39). Через 10 дней (прогноз на 30-й день жизни) ситуация сохранилась: sindiv=12.14 (sdemogr=12.06). Это означает, что более высокое качество индивидуального предсказания на основании яйценесения по сравнению с демографическим предсказанием обеспечивается исключительно за счет сдвига математического ожидания распределения прогностических данных. Тем самым подтвердилось принятое сегодня мнение о том, что индивидуальный прогноз ППЖ давать нецелесообразно, если это вообще можно сделать.
Другой подход, основанный на выделении группы риска, оказывается значительно надежнее индивидуального прогноза. Формирование групп риска производится следующим образом. В популяции измеряются некоторые параметры составляющих ее особей xi= [х1, х2 ...хn], где i - номер особи (i= 1, 2, ... N). Если некоторые из х1, х2 ...хn положительно коррелируют со степенью угрозы, то их называют маркерами данной угрозы. Задаваясь такими xi, можно использовать любые модели для прогнозирования результата действия угрозы на данную особь. Если F(xi) представляет собой модель (например, решающее правило), а G - область поражения, то F(xi)ÎG означает, что согласно этой модели i‑я особь поражена, а F(xi)ÏG - что особь не поражена (также согласно этой модели).
В соответствии с предсказанием модели F все особи, для которых выполнено условие F(xi)ÎG, оказываются пораженными. Однако используемая модель обычно неточна, и действие неучтенных факторов приводит к тому, что реально в группе xi: F(xi)ÎG, поражается только часть особей. Поэтому группу особей xi, для которых F(xi)ÎG, называют группой риска. Доля реально пораженных особей, находящихся в группе риска, позволяет дополнительно оценить качество и адекватность модели.
Алгоритм прогноза, использованный в (Новосельцев с соавт. 2007, 2008), можно рассматривать как модель F, а параметры паттерна яйценесения - как вектор xi. Область G образуется следующим образом. Если прогнозируемая величина ППЖ меньше величины t+10, то данный индивидуум включается в группу риска (t -день прогноза; t = 20, 25 и 30 дней).
Прогноз во всех случаях оказался успешным. Так, на 20-й день в популяции мушек живыми из 1000 оставались 782 мушки, из которых в группу риска попало 276 особей. Из них на интервале 20-30 дней реально умерло 113 мушек, т.е. 41%. Из оставшихся 506 мушек умерло 90 мушек (18 %). Аналогичные цифры получены для прогноза на 25-й день (в группе риска умерло 172 мушек из 295, т.е. 58% против 115 из 417 в оставшейся группе, т.е. 28%). На 30-й день в группе риска умерло 163 мушки из 264 (62%) против 129 из 338 у оставшихся (38%).