Научный журнал
Фундаментальные исследования
ISSN 1812-7339
"Перечень" ВАК
ИФ РИНЦ = 1,749

МЕТОДИЧЕСКИЕ АСПЕКТЫ ОБОБЩЕННЫХ МЕТОДОВ ДИАГНОСТИКИ В МОДЕЛЯХ ВЕКТОРНОЙ АВТОРЕГРЕССИИ

Бабешко Л.О. 1
1 ФГБОУ ВО «Финансовый университет при Правительстве РФ»
Моделям векторной авторегрессии (VAR), предложенным Симсом в 1980 г., свободным от проблем идентификации переменных и нашедшим широкое применение благодаря их гибкости, релевантности, сопоставимости по точности со сложными структурными макроэкономическими моделями, простоте реализации и экономической интерпретации результатов, посвящено множество публикаций прикладного характера. При построении эконометрических моделей любых типов, в том числе и моделей векторной авторегрессии, одним из важнейших этапов является этап проверки выполнения их предпосылок – диагностика моделей. Для упрощения анализа m-мерный VAR(p)-процесс представляют в виде mp-мерного VAR(1)-процесса. Такой подход позволяет применять для оценки и прогнозирования векторной авторегрессии аппарат, разработанный для моделей авторегрессии одномерных временных рядов, а к диагностике моделей VAR(p) применять тесты, включающие обобщённые статистики одномерных аналогов. Для тестирования предпосылок моделей векторной авторегрессии разработаны обобщенные тесты – многомерные аналоги одномерных тестов на автокорреляцию (Portmanteau Test, PT.adjusted), гетероскедастичность (Breusch-Godfrey, Edgerton-Shukur), нормальность распределения возмущений (Jarque-Bera test), тестирование причинности (Granger). Поскольку в последние десятилетия в качестве инструментальной поддержки эконометрических методов оценки, диагностики и анализа моделей в большинстве экономических вузов используется бесплатная альтернатива профессиональным специализированным пакетам – программная среда R, в статье обсуждаются вопросы реализации многомерных тестов диагностики VAR-моделей на языке R.
модель векторной авторегрессии
диагностические тесты
тест Харке – Бера
обобщенный тест Харке – Бера
тесты Портманто
коэффициент асимметрии
куртозис
1. Маматова Н. Применение модели векторной авторегрессии для анализа потребления электроэнергии // Математические модели экономики. 2015. № 4. С. 15–19.
2. Паньков М.О. Анализ взаимосвязей торгов акций на фондовых биржах с применением методов векторной авторегрессии // Финансовый менеджмент. 2018 № 3. С. 39–43.
3. Суханова Е.И., Ширнаева С.Ю. Прогнозирование показателей стабилизационных процессов экономики России на основе моделей векторной авторегрессии // Фундаментальные исследования. 2014. № 9–7. С. 1590–1595.
4. Бабешко Л.О., Бич М.Г., Орлова И.В. Эконометрика и эконометрическое моделирование: учебник. М.: Вузовский учебник: ИНФРА-М, 2017. 400 с.
5. Носко В.П. Эконометрика Кн. 2. Ч. 3, 4: учебник. М.: Издательский дом «Дело» РАНХиГС, 2011. 576 с.
6. Jarque C.M. and Bera A.K. A test for normality of observations and regression residuals, International Statistical Review. 1987. № 55. P. 163–172.
7. Kleiber C. Applied Econometrics with R. N.Y.. Springer-Verlag, 2008. P. 222.
8. Pfaff B. Analysis of Integrated and Cointegrated Time Series with R. Springer, 2008. 189 p.
9. Зададаев С.А. Математика на языке R: учебник. М.: Прометей, 2018. 324 с.
10. Айвазян С.А., Фантаццини Д. Эконометрика-2: Продвинутый курс с приложениями в финансах: учебник. М.: Магистр: Инфра-Ь, 2014. 944 c.

Модели векторной авторегрессии (VAR, vector autoregressive model), предложенные Кристофером Симсом в 1980 г. и предназначенные для описания нескольких динамических процессов на основе их общей истории, широко используются как альтернатива сложным структурным макроэкономическим моделям благодаря их гибкости, релевантности, сопоставимости по точности, простоте реализации и экономической интерпретации результатов [1–3]. Данный факт особенно важен для повышения мотивации студентов экономических направлений вузов к изучению многомерных моделей временных рядов в эконометрике и их применению при исследовании экономических процессов.

Модели векторной авторегрессии, с одной стороны, являются обобщением авторегрессионных моделей для многомерных временных рядов, с другой – частным случаем систем одновременных уравнений, сохраняя преемственность в методах оценивания, диагностики и исследования, изучаемых студентами бакалавриата в рамках базовой дисциплины «Эконометрика». При построении эконометрических моделей любых типов (моделей временных рядов, регрессионных моделей с одним уравнением, систем одновременных уравнений) одним из важнейших этапов является этап проверки выполнения их предпосылок – диагностика моделей. Большинство диагностических тестов (Diagnostic Tests) базируется на предпосылке нормальности распределения вектора возмущений. Нарушение этой предпосылки приводит к ошибочным выводам и интерпретации результатов оценивания [4, 5].

Для проверки нормальности распределения возмущений, по крайней мере в эконометрике, широкое применение получил тест Харке – Бера (Jarque-Bera), реализация которого выполнена практически во всех эконометрических пакетах [6–8]. Обобщенный вариант теста используется для проверки нормальности распределения вектора возмущений модели векторной авторегрессии. Для проверки остатков модели на наличие автокорреляции применяется обобщённая процедура тестов Бокса – Пирса (Box-Pierce Q-statistic) и Бокса – Льюинга (Ljung-Box Q-statistic). Для исследования гетероскедастичности в многомерных моделях временных рядов используются обобщенные тесты ARCH.

Поскольку в последние десятилетия в качестве инструментальной поддержки эконометрических методов оценки, диагностики и анализа моделей, в большинстве экономических вузов используется бесплатная альтернатива профессиональным специализированным пакетам – программная среда R [9], реализация многомерных тестов будет рассмотрена на языке R.

Обобщенный тест Харке – Бера на нормальность распределения ошибок модели VAR

Одним из достоинств моделей векторной авторегрессии является отсутствие необходимости априорных ограничений на параметры модели, гарантирующих идентификацию. Включенные в спецификацию переменные – эндогенные переменные модели, зависят от своих прошлых значений и прошлых значений других переменных.

Для упрощения анализа m-мерный VAR(p)-процесс представляют в виде mp-мерного VAR(1)-процесса (m – число переменных модели, p – максимальная величина лага) [10]. Такой подход реализован в функции VAR() пакета vars программной среды R и позволяет применять для оценки и прогнозирования векторной авторегрессии аппарат, разработанный для моделей авторегрессии одномерных временных рядов, а к диагностике моделей VAR(p) применять тесты, включающие обобщённые статистики одномерных аналогов.

Статистика одномерного (univariate) теста Харке – Бера (Jarque-Bera test) [6, 10] на нормальность распределения остатков эконометрической модели основана на сравнении центральных нормированных моментов третьего (коэффициент асимметрии, Skewness), Bab01.wmf, и четвертого (коэффициент эксцесса, Kurtosis) Bab02.wmf порядков с соответствующими характеристиками нормального распределения, для которого, как известно, S = 0, K = 3, и имеет вид

Bab03.wmf. (1)

Оценки характеристик, включенных в формулу (1), вычисляются через остатки (e) регрессионной модели:

Bab04.wmf, Bab05.wmf,

Bab06.wmf.

Нулевая и альтернативная гипотезы теста Харке – Бера формулируются следующим образом: H0: S = 0, K = 3, H1: S ≠ 0, K ≠ 3.

Статистика (1) имеет распределение хи-квадрат с двумя степенями свободы, и, если вычисленное значение больше критического, нулевая гипотеза о нормальном распределении возмущений регрессионной модели не отклоняется. Тест Харке – Бера является асимптотическим тестом и применим к большим выборкам.

В обобщенной процедуре (multivariate) многомерного теста Харке – Бера, нормирование моментов выполняется при помощи матрицы факторизации P для оценки автоковариационной матрицы остатков модели VAR (p), представляющей собой нижнюю треугольную матрицу с положительными диагональными элементами (полученную при помощи разложения Холецкого), Bab07.wmf. Разложение можно также записать через верхнюю треугольную матрицу Bab08.wmf, где Bab09.wmf. Статистика обобщенного теста вычисляется по формуле [10]:

Bab10.wmf, (2)

где

Bab11.wmf,

Bab12.wmf, (3)

Bab13.wmf,

Bab14.wmf, Bab15.wmf.

Статистики (2), (3) реализованы в R при помощи функции normality.test() пакета {vars}: normality.test(x, multivariate.only = TRUE), с основными параметрами: x – объект класса "Varest", генерируемого VAR() или объект класса vec2var, генерируемого vec2var (); multivariate.only – логическая переменная, если TRUE (по умолчанию), вычисляется только статистика многомерного теста (2), если FALSE, вычисляются статистики для многомерного теста (2) и многомерных коэффициентов асимметрии и эксцесса (3). Объекты, созданные функциями с расширением test, поддерживают графическое представление эмпирического распределения остатков модели VAR(p) (и их квадратов), а также их автокорреляционной функции (ACF) и функции частных автокорреляций (PACF) [8].

Обобщенные тесты на автокорреляцию остатков

Для проверки адекватности моделей векторной авторегрессии, так же как и для моделей одномерных временных рядов, применяются тесты на отсутствие автокорреляции остатков, в частности обобщение тестов Бокса – Пирса (Box-Pierce Q-statistic) и Бокса – Льюинга (Ljung-Box Q-statistic), которые реализованы в эконометрических пакетах.

Для проверки нулевой гипотезы H0: ρ1 = ρ2 = ...= ρh = 0, против альтернативной Bab16.wmf, в тесте Бокса – Пирса используется статистика Q:

Bab17.wmf, (4)

где ρi) – теоретические значения коэффициентов корреляции, r(i) – выборочные коэффициенты корреляции с числовыми характеристиками: Bab18.wmf, Bab19.wmf, h – порядок автокорреляции, для которого выполнена нулевая предпосылка. Если уровни временного ряда – белый шум, то коэффициенты автокорреляции Bab20.wmf асимптотически независимы и при большом объеме наблюдений Bab21.wmf. Вычисленное по формуле (4) значение статистики сравнивается с критическим, и если Bab22.wmf, то нулевая гипотеза о белом шуме (отсутствии автокорреляции) отклоняется на уровне значимости α (правосторонняя критическая область). Обобщением статистики (4) для случая моделей VAR(p) является статистика теста Портманто (Portmanteau Test, (PT.asymptotic)):

Bab23.wmf, (5)

где

Bab24.wmf, Bab25.wmf (6)

– оценка автоковариационной матрицы остатков модели VAR(p), p – порядок модели векторной авторегрессии, h – порядок автокорреляции, для которого выполнена нулевая предпосылка, m – число эндогенных переменных модели. Статистика (5) используется для проверки нулевой гипотезы:

Bab26.wmf (7)

где Ri – автокорреляционная матрица, оценка которой вычисляется по формуле

Bab27.wmf (8)

где Bab28.wmf – диагональная матрица с диагональными элементами, равными стандартным ошибкам возмущений VAR(p)-процесса

Bab29.wmf

На малых выборках используют тест Бокса – Льюинга со статистикой

Bab30.wmf, (9)

в которую каждое слагаемое входит со своим весом Bab31.wmf.

Обобщенный (многомерный) вариант статистики (9) для моделей VAR(p) с учетом (5) принимает вид (PT.adjusted):

Bab32.wmf. (10)

Для тестирования автокорреляции используется также обобщенный вариант теста Бреуша – Годфри. Тест является асимптотическим, то есть для достоверности выводов требуется большой объём выборки. В тесте рассматривается авторегрессия остатков на их лаговые значения и оцениваются две модели: исходная модель VAR(p) (усечённая, с ограничениями, restricted)

Bab33.wmf, (11)

и вспомогательная, общая (неусеченная, без ограничений, unrestricted) модель

Bab34.wmfBab35.wmf, (12)

где et – остатки, полученные в результате МНК оценивания основной модели (11), et–j = 0 при t < j +1. Если нулевая гипотеза

Bab36.wmf

(против альтернативной Bab37.wmf для i = 1,2...,h) верна, то при большом значении объема выборки Т статистика теста определяется по формуле [8]:

Bab38.wmf, (13)

где ΩR – автоковариационная матрица вектора остатков исходной (усечённой) модели VAR(p) (11), ΩUR – автоковариационная матрица вектора остатков неусеченной модели (12), m – число эндогенных переменных модели, имеет хи-квадрат распределение с параметром hm2, и гипотеза не отклоняется при уровне значимости α, если выполняется неравенство

Bab39.wmf.

Тесты на проверку наличия автокорреляции реализованы в программной среде R при помощи функции serial.test() пакета{vars}:

serial.test (x, lags.pt, lags.bg, type = c("PT.asymptotic", "PT. adjusted", "BG")),

с основными аргументами: x – объект, генерируемый функцией VAR(); lags.pt – величина лага, используемая в статистике теста Портманто (5), lags.bg – величина лага, используемая в статистике теста Бреуша – Годфри (13); type – тип теста: PT.asymptotic – (5); PT.adjusted – (10); BG – Breusch-Godfrey – (13). По умолчанию используется асимптотический тест Портманто.

Обобщенные тесты на гетероскедастичность остатков

Для исследования гетероскедастичности в многомерных моделях временных рядов используются тесты ARCH, основанные на оценивании вспомогательной модели вида [10]:

Bab40.wmfBab41.wmf, (14)

где vt – процесс белого шума, vec(•) – оператор формирования вектора из нижней треугольной матрицы с элементами на главной диагонали и вертикальным выстраиванием её столбцов. Для реализации оператора vec(•) в программной среде используется функция lower.tri(x,diag=TRUE), пакета {base}, с основными параметрами: x – матрица, diag – логическая переменная: TRUE – включать элементы на главной диагонали, FALSE – не включать элементы на главной диагонали. Если размерность матрицы x – (m×m), то сформированный вектор имеет размерность – m(m + 1)/2.

Таким образом, размерность параметров в модели (14):

β0 – m(m + 1)/2, Bi – Bab42.wmf, i = 1,...,q.

Нулевая и альтернативная гипотезы формулируются следующим образом:

Bab43.wmf, Bab44.wmf,

и проверяются при помощи статистики

Bab45.wmf, (15)

с коэффициентом детерминации:

Bab46.wmf,

где Bab47.wmf – автоковариационная матрица вектора возмущений модели без ограничений на параметры, Bab48.wmf – с ограничениями на параметры в рамках гипотезы H0. Статистика (15) реализована в программной среде R в виде функции arch.test() пакета vars, которая вычисляет одномерные и многомерные тесты ARCH-LM для моделей VAR (p). Основные параметры функции:

arch.test(x, lags.single = 16, lags.multi = 5, multivariate.only = TRUE),

где x – объект класса "Varest", генерируется VAR () или vec2var(); lags.single – целое число, указывающее величину лага для одномерной статистики ARCH; lags.multi – целое число, указывающее величину лага для многомерной статистики ARCH; multivariate.only – Если TRUE (по умолчанию), вычисляется только статистика многомерного теста.

В таблице приведены скрипт и фрагмент протокола результатов оценивания и диагностики модели векторной авторегрессии VAR(1), оцененной для двух эндогенных переменных: объём инвестиций и величина капитала, по годовым данным фирмы «General Electric» за 20 лет, встроенным в пакет "AER".

Результаты оценки и диагностики модели VAR(p)

Фрагменты скрипта

Фрагменты протокола

#оценка модели VAR

library(tseries)

adf.test()

library(vars)

library("AER")

data("Grunfeld",package="AER")

Y<-GE$invest

X<-GE$capital

Dy<- diff(Y)

Dx<- diff(X)

#adf.test(Dy)

#adf.test(Dx)

varmat <- as.matrix(cbind(Dy,Dx))

varfit <- VAR(varmat,1,type="trend",ic="AIC")

summary(varfit)

Estimation results for equation Dy:

===================================

Dy = Dy.l1 + Dx.l1 + trend

Estimate Std.Error t value Pr(>|t|)

Dy.l1 -0.2328 0.2139 -1.089 0.29352

Dx.l1 -0.8288 0.2300 -3.603 0.00261 **

trend 3.8148 1.0155 3.757 0.00191 **

Residual standard error: 23.32 on 15 df

Multiple R-Squared: 0.5133, Adj R-squared: 0.416

F-statistic: 5.274 on 3 and 15 DF, p-value: 0.01104

Estimation results for equation Dx:

===================================

Dx = Dy.l1 + Dx.l1 + trend

Estimate Std. Error t value Pr(>|t|)

Dy.l1 0.95253 0.07516 12.674 2.04e-09 ***

Dx.l1 0.90503 0.08083 11.197 1.11e-08 ***

trend 0.07676 0.35684 0.215 0.833

Residual standard error: 8.193 on 15 df

Multiple R-Squared: 0.9809, Adj R-squared: 0.977

F-statistic: 256.4 on 3 and 15 DF, p-value: 4.166e-13

Окончание таблицы

Фрагменты скрипта

Фрагменты протокола

# диагностика:

 

# проверка на гетероскедастичность

arch.test(varfit, lags.single = 1, lags.multi=1,multivariate.only= TRUE)

ARCH (multivariate)

data: Residuals of VAR object varfit

Chi-squared = 10.866, df = 9, p-value = 0.285

# проверка на автокорреляцию

serial.test(varfit, lags.pt = 16, type = "PT.adjusted")

Portmanteau Test (adjusted)

data: Residuals of VAR object varfit

Chi-squared = 60.636, df = 60, p-value = 0.4527

# проверка на нормальность

var.norm<-normality.test(varfit, multivariate.only = TRUE)

JB-Test (multivariate)

data: Residuals of VAR object varfit

Chi-squared = 9.5024, df = 4, p-value = 0.0497

Skewness only (multivariate)

data: Residuals of VAR object varfit

Chi-squared = 5.9443, df = 2, p-value = 0.05119

Kurtosis only (multivariate)

data Residuals of VAR object varfit

Chi-squared = 3.5581, df = 2, p-value = 0.1688

 

Выводы

Как следует из протокола, остатки модели имеют нормальное распределение. Включение лаговых переменных в спецификацию Var(p) позволило преодолеть проблему автокорреляции, уточнить причинно-следственные связи и повысить качество модели.

С точки зрения образовательного процесса аппарат Var-моделей полностью соответствует принципу систематичности и последовательности обучения: новый учебный материал по построению и диагностике VAR (p) моделей базируется на знаниях ранее изученных эконометрических методов, расширяет и дополняет их.


Библиографическая ссылка

Бабешко Л.О. МЕТОДИЧЕСКИЕ АСПЕКТЫ ОБОБЩЕННЫХ МЕТОДОВ ДИАГНОСТИКИ В МОДЕЛЯХ ВЕКТОРНОЙ АВТОРЕГРЕССИИ // Фундаментальные исследования. – 2020. – № 5. – С. 27-32;
URL: https://fundamental-research.ru/ru/article/view?id=42742 (дата обращения: 28.05.2022).

Предлагаем вашему вниманию журналы, издающиеся в издательстве «Академия Естествознания»
(Высокий импакт-фактор РИНЦ, тематика журналов охватывает все научные направления)

«Фундаментальные исследования» список ВАК ИФ РИНЦ = 1.074