Scientific journal
Fundamental research
ISSN 1812-7339
"Перечень" ВАК
ИФ РИНЦ = 1,674

ECONOMETRIC MODELING OF DEMOGRAPHIC TIME SERIES WITH DECREASING LOGISTIC TRENDS

Kozhukhova V.N. 1
1 National Research Nuclear University MEPhI
We studied demographic time series in developed countries. We used parametric modeling approach to get crude death rates (per 1,000 people) forecast for the USA and Switzerland population. We proposed time series decomposition including trend and cyclical components. We used seven new logistic growth curves, changing well-known models proposed by Ramsey, Verhulst and Gompertz. We fit models to the data using RPROP algorithm, ARMA-modeling with Z-transform and Levenberg-Marquardt algorithm for solving MLS. We eliminated trend and fit cyclical component as a harmonic with constant amplitude also by ARMA-modeling with Z-transform. We proposed using Zagoruyko criteria to estimate forecast accuracy on decreasing logistic trend. We showed that using U1-statistics is incorrect in this case. So we computed forecast points up to 27 years for the USA and 38 years for Switzerland. We estimated death asymptote rate for the next 40 years in developed countries. Our tools for demographic modeling can be applied for birth rates and life expectancy.
demography
crude death rate
modeling
forecasting
logistic curve
1. Kozhukhova V.N., Semenychev E.V. Metodiki issledovaniya tochnosti identifikatsii vremennykh ryadov na primere modeley s logisticheskim trendom i additivnoy stokhasticheskoy komponentoy. Vestnik Povolzhskogo gosudarstvennogo universiteta servisa. Seriya «Ekonomika», 2013, no. 2(28), pp. 148–153.
2. Kozhukhova V.N., Semenychev V.K., Semenychev E.V. Metody identifikatsii logisticheskoy dinamiki i zhiznennogo tsikla produkta modelyu Verkhulsta. Ekonomika i matematicheskie metody, 2012, Vol. 48, no. 2, pp. 108–115.
3. Kozhukhova V.N. Razrabotka i issledovanie kompleksa modeley logisticheskoy dinamiki sotsial›no-ekonomicheskikh pokazateley: Avtoref. dis. kand. ekon. nauk. Orenburg, 2013, рp. 25.
4. Kormanovskaya I.R., Bernasovskaya L.I., Ptitsina E.V. Modelirovanie stsenariya demograficheskogo razvitiya Novgorodskoy oblasti do 2030 goda. Problemy sovremennoy ekonomiki, 2012, no. 3(43), pp. 224–228.
5. Semenychev V.K., Kozhukhova V.N. Analiz i predlozheniya modeley ekonomicheskoy dinamiki s kumulyativnym logisticheskim trendom: monografiya. Samara, SamNTs RAN, 2013, pр. 152.
6. «IndexMundi – Country Facts». Index Mundi. Available at: http://www.indexmundi.com/ (accessed July 6, 2014).
7. Modis Theodore. Predictions: 10 years later. Geneva: Growth Dynamics, 2002.

При математическом моделировании демографических процессов наиболее часто применяются динамические, имитационные и регрессионные модели, описанные в работах отечественных ученых С.П. Капицы, Ю.М. Плотинского, С.Ю. Малкова, А.А. Саградова и др. Большинство моделей касается численности населения региона, страны или мира в целом, в то время как моделей рождаемости, смертности, ожидаемой продолжительности жизни предложено меньше [4]. Регрессионные модели этих показателей, как правило, строятся на основе временных рядов применением какой-либо нелинейной функции тренда (логарифмической, экспоненциальной, степенной).

В работах зарубежных ученых, например [7], отмечается, что динамика подобных показателей носит логистический характер и описывается S-образными кривыми, а применение экспоненциальных кривых некорректно. Так, ожидаемая продолжительность жизни в развитых странах представляет собой растущую логистическую кривую, смертности – падающую. Прогнозы ожидаемой продолжительности жизни и численности населения на основе растущей логистической кривой осуществлялись Р. Перлом, А. Грюблером, Т. Модисом, П. Майером и др. Оценка параметров логистической модели с уменьшающимися абсолютными значениями тренда (для падающей кривой) является нетривиальной задачей, поскольку получение прогноза при стремлении показателя к нулю требует других моделей, методов их идентификации и новых показателей точности прогноза.

Цель исследования. В настоящей работе поставлена цель продемонстрировать применение предложенного комплекса параметрических эконометрических моделей с логистическим характером тренда, показать возможность получения прогнозов демографических показателей смертности населения.

Материал и методы исследования

Использована статистика общего коэффициента смертности в развитых странах мира (в статье показаны примеры США и Швейцарии, однако исследование включало и множество других стран). Использование зарубежной статистики связано с недостаточностью исходной статистической информации для Российской Федерации (особенно с тем фактом, что Россия лишь недавно встала на путь снижения смертности населения). Таким образом, предлагаемые модели разработаны «на перспективу» их применения для России.

Общий коэффициент смертности представляет собой отношение числа умерших людей за год в стране к средней численности населения за год и, как правило, рассчитывается на 1000 чел. населения (в ‰). Динамика общего коэффициента смертности с развитием цивилизации, в частности медицины, снижается, стремясь к некоторому пределу.

Известно, что логистическая кривая условно представляет собой три стадии роста: ускоряющуюся экспоненциальную, линейную и замедляющуюся экспоненциальную [5].

Доступные выборки статистических данных включают в себя линейную и замедляющуюся экспоненциальную стадии логистической кривой, которая стремится к уровню спада – нижней горизонтальной асимптоте. Для США известны данные 1930–2012 гг. (83 наблюдения), для Швейцарии – 1900–2013 гг. (114 наблюдений) [6].

Рассмотренный комплекс моделей трендов падающей логистической динамики включал следующие модели [5]:

1) модель Рамсея с константой

koguh01.wmf

2) трехпараметрическая модель Рамсея

koguh02.wmf

3) четырехпараметрическая модель Рамсея

koguh03.wmf

4) обобщенная модель Ферхюльста

koguh04.wmf

5) модель Ричардса

koguh05.wmf

6) модель Гомпертца с левой асимметрией

koguh06.wmf

7) модель Гомпертца с правой асимметрией

koguh07.wmf

где Yk – фактические значения временного ряда; k = 1, ..., n – номера наблюдений; n – объем выборки; εk – стохастическая компонента; Δ – период дискретизации (месяц, квартал, год и т.д.); C, A0, B0, B1, α, k0, M – параметры моделей.

Циклическая компонента может присутствовать во временных рядах и моделироваться суммой r гармоник

koguh08.wmf

Все предложенные модели нелинейны по параметрам. Оценивались параметры с помощью методов:

а) конструирования обобщенных параметрических ARMA-моделей с помощью Z-преобразования для моделей 1–3, а также моделей циклической компоненты;

б) численного решения МНК методом Левенберга ‒ Марквардта для модели 4 [2];

в) алгоритма RPROP (из теории нейронных сетей) для моделей 5–7.

Данные методы показали вычислительную устойчивость при их тестировании на искусственно сгенерированных выборках [1].

В качестве критерия точности моделирования используется коэффициент (индекс) детерминации R2, а для точности прогнозирования ‒ критерий Н.Г. Загоруйко [3]:

koguh09.wmf

где l – горизонт прогноза; koguh10.wmf – рассчитанные по модели значения ряда; Ymax, Ymin – максимальное и минимальное значения в выборке соответственно.

Данный критерий применяется потому, что при анализе моделей с падающим трендом на тестовых выборках была продемонстрирована некорректность применения таких общепринятых показателей, как MAPE-оценка и второй коэффициент Тейла, для оценки точности прогноза. Критерий Н.Г. Загоруйко обладает большей универсальностью и точностью: он дает сопоставимые результаты как для растущего, так и для падающего трендов. Показано, что для достоверных прогнозов значение критерия Н.Г. Загоруйко для падающих кривых не должно превышать 10 %, что соответствует рекомендованному значению второго коэффициента Тейла в 20 % для растущих кривых [3].

Для оценки точности прогноза исходный ряд показателя разбивался на две части: рабочую и контрольную. Для построения модели использовались данные рабочей части, а по контрольной рассчитывались значения показателя точности прогноза. В контрольную часть выносилась 1/3 исходной выборки – 27 последних наблюдений для США и 38 последних наблюдений для Швейцарии. Предполагается, что в будущем будет получена точность прогноза того же порядка. Для формирования окончательной модели контрольная выборка вновь объединялась с рабочей.

Для сравнения моделей и обоснования выбора лучшей по адекватности модели из комплекса предложенных применялся скорректированный критерий Акаике, штрафующий за увеличение числа параметров.

Результаты исследования и их обсуждение

Предварительный анализ данных показал, что структура временного ряда для общего коэффициента смертности одинакова и носит аддитивный характер:

koguh11.wmf,

выделяются тренд Tk и циклическая компонента Ck. Наличие циклической компоненты было подтверждено анализом стохастической компоненты после элиминирования тренда, а также анализом автокорреляционной функции рядов. Период дискретизации Δ принят равным 1. Для каждого случая был выбран наилучший тренд в соответствии с тремя критериями (таблица).

Результаты расчета критериев точности моделирования и прогнозирования для семи логистических трендов

Номер модели

Число параметров

США

Швейцария

R2

Z

AICc

R2

Z

AICc

1

3

0,899

10,07 %

154,96

0,945

3,12 %

489,35

2

3

0,914

5,23 %

143,16

0,968

2,69 %

461,50

3

4

0,914

5,39 %

145,15

0,968

2,68 %

463,56

4

4

0,906

7,07 %

150,58

0,959

2,97 %

474,62

5

5

0,912

5,30 %

148,03

0,961

2,79 %

468,09

6

4

0,910

5,97 %

147,11

0,964

2,90 %

468,25

7

4

0,911

5,91 %

146,91

0,966

2,77 %

466,65

Наилучший тренд по трем критериям для США – трехпараметрическая модель Рамсея. Для Швейцарии картина не столь однозначна: два тренда показали примерно одинаковую точность. В данном случае рекомендовано выбрать тренд с меньшим числом параметров. На основе выделения тренда для развитых стран (в том числе и на других примерах) можно сказать, что трехпараметрическая модель Рамсея лучше других отражает динамику смертности. Вид моделей трендов:

для США

koguh12.wmf

для Швейцарии

koguh13.wmf

Циклическая компонента представляет собой одну гармонику с постоянной амплитудой:

для США

koguh14.wmf

для Швейцарии

koguh15.wmf

Циклическая компонента отражает колебания в динамике смертности с периодом в 28 лет для США, 40 лет – для Швейцарии.

Рассчитанные критерии точности моделирования и прогнозирования для итоговых моделей оказались высокими: R2 = 0,963; Z = 3,06 % для США, R2 = 0,943; Z = 5,04 % для Швейцарии. На рисунке, а и б, представлены результаты моделирования динамики общего коэффициента смертности для США и Швейцарии соответственно.

аpic_59.wmfб

Моделирование динамики общего коэффициента смертности на 1000 чел. населения в США (а) и Швейцарии (б), ‰

Прогнозируемые по модели уровни спада составили 8,06 и 8,25 для США и Швейцарии соответственно. Коэффициент α ≈ 0,02 для обоих стран показывает темп выбытия населения. Таким образом, в ближайшие 30–40 лет на современном этапе развития медицины среднегодовая смертность стабилизируется на уровне 8 чел. на 1000 чел. населения развитых стран. Также получены прогнозные значения по годам на 27 лет вперед для США и 38 лет вперед для Швейцарии.

Заключение

Предложенный комплекс моделей может быть применен и для иных демографических показателей, если целью исследователя ставится задача построения параметрической модели. В работе [1] на примере ожидаемой продолжительности жизни предложен метод получения интервальных оценок точности прогноза для моделей с логистическим трендом с помощью генерации тестовых выборок. Такой метод позволяет получить не только основной прогноз развития показателя, но и его пессимистический и оптимистический варианты.

В случае достаточности статистических данных разработанные эконометрические модели и методы их идентификации могут быть применены и для демографических показателей Российской Федерации.

Рецензенты:

Семенычев В.К., д.э.н., д.т.н., профессор, ректор, МБОУ ВО «Самарская академия государственного и муниципального управления», г. Самара;

Ильмушкин Г.М., д.п.н., к.ф.-м.н., профессор, заведующий кафедрой высшей математики, Димитровградский инженерно-технологический институт – филиал ФГАОУ ВПО «Национальный исследовательский ядерный университет «МИФИ», г. Димитровград.

Работа поступила в редакцию 23.07.2014.