Scientific journal
Fundamental research
ISSN 1812-7339
"Перечень" ВАК
ИФ РИНЦ = 1,749

METHODICAL ASPECTS OF GENERALIZED DIAGNOSTICS METHODS IN VECTOR AUTOREGRESSIVE MODELS

Babeshko L.O. 1
1 Financial University under the Government of the Russian Federation
The vector autoregression (VAR) models proposed by Sims in 1980, free of variable identification problems and widely used due to their flexibility, relevance, comparability in accuracy with complex structural macroeconomic models, simplicity of implementation and economic interpretation of the results, are devoted many publications of an applied nature. When constructing econometric models of any type, including vector autoregressive models, one of the most important stages is the stage of verifying that their premises are fulfilled – model diagnostics. To simplify the analysis, the m-dimensional VAR (p) -process is represented as an mp-dimensional VAR (1) -process. This approach makes it possible to use the apparatus developed for autoregressive models of one-dimensional time series for estimating and predicting vector autoregression, and apply tests including generalized statistics of one-dimensional analogues to the diagnosis of VAR (p) models. To test the prerequisites of the vector autoregressive models, generalized tests have been developed – multidimensional analogues of one-dimensional autocorrelation tests (Portmanteau Test, PT.adjusted), heteroscopic behavior (Breusch-Godfrey, Edgerton-Shukur), normal distribution of disturbances (Jarque-Bera test), causality testing (Granger). Since in recent decades, as an instrumental support for econometric methods of model assessment, diagnostics, and analysis, most economic universities use a free alternative to professional specialized packages – the software environment R, the article discusses the implementation of multivariate diagnostic tests of VAR models in the R language.
vector autoregressive models
diagnostic tests
Jarque-Bera test
generalized Jarque-Bera test
Portmanteau tests
skewness
kurtosis

Модели векторной авторегрессии (VAR, vector autoregressive model), предложенные Кристофером Симсом в 1980 г. и предназначенные для описания нескольких динамических процессов на основе их общей истории, широко используются как альтернатива сложным структурным макроэкономическим моделям благодаря их гибкости, релевантности, сопоставимости по точности, простоте реализации и экономической интерпретации результатов [1–3]. Данный факт особенно важен для повышения мотивации студентов экономических направлений вузов к изучению многомерных моделей временных рядов в эконометрике и их применению при исследовании экономических процессов.

Модели векторной авторегрессии, с одной стороны, являются обобщением авторегрессионных моделей для многомерных временных рядов, с другой – частным случаем систем одновременных уравнений, сохраняя преемственность в методах оценивания, диагностики и исследования, изучаемых студентами бакалавриата в рамках базовой дисциплины «Эконометрика». При построении эконометрических моделей любых типов (моделей временных рядов, регрессионных моделей с одним уравнением, систем одновременных уравнений) одним из важнейших этапов является этап проверки выполнения их предпосылок – диагностика моделей. Большинство диагностических тестов (Diagnostic Tests) базируется на предпосылке нормальности распределения вектора возмущений. Нарушение этой предпосылки приводит к ошибочным выводам и интерпретации результатов оценивания [4, 5].

Для проверки нормальности распределения возмущений, по крайней мере в эконометрике, широкое применение получил тест Харке – Бера (Jarque-Bera), реализация которого выполнена практически во всех эконометрических пакетах [6–8]. Обобщенный вариант теста используется для проверки нормальности распределения вектора возмущений модели векторной авторегрессии. Для проверки остатков модели на наличие автокорреляции применяется обобщённая процедура тестов Бокса – Пирса (Box-Pierce Q-statistic) и Бокса – Льюинга (Ljung-Box Q-statistic). Для исследования гетероскедастичности в многомерных моделях временных рядов используются обобщенные тесты ARCH.

Поскольку в последние десятилетия в качестве инструментальной поддержки эконометрических методов оценки, диагностики и анализа моделей, в большинстве экономических вузов используется бесплатная альтернатива профессиональным специализированным пакетам – программная среда R [9], реализация многомерных тестов будет рассмотрена на языке R.

Обобщенный тест Харке – Бера на нормальность распределения ошибок модели VAR

Одним из достоинств моделей векторной авторегрессии является отсутствие необходимости априорных ограничений на параметры модели, гарантирующих идентификацию. Включенные в спецификацию переменные – эндогенные переменные модели, зависят от своих прошлых значений и прошлых значений других переменных.

Для упрощения анализа m-мерный VAR(p)-процесс представляют в виде mp-мерного VAR(1)-процесса (m – число переменных модели, p – максимальная величина лага) [10]. Такой подход реализован в функции VAR() пакета vars программной среды R и позволяет применять для оценки и прогнозирования векторной авторегрессии аппарат, разработанный для моделей авторегрессии одномерных временных рядов, а к диагностике моделей VAR(p) применять тесты, включающие обобщённые статистики одномерных аналогов.

Статистика одномерного (univariate) теста Харке – Бера (Jarque-Bera test) [6, 10] на нормальность распределения остатков эконометрической модели основана на сравнении центральных нормированных моментов третьего (коэффициент асимметрии, Skewness), Bab01.wmf, и четвертого (коэффициент эксцесса, Kurtosis) Bab02.wmf порядков с соответствующими характеристиками нормального распределения, для которого, как известно, S = 0, K = 3, и имеет вид

Bab03.wmf. (1)

Оценки характеристик, включенных в формулу (1), вычисляются через остатки (e) регрессионной модели:

Bab04.wmf, Bab05.wmf,

Bab06.wmf.

Нулевая и альтернативная гипотезы теста Харке – Бера формулируются следующим образом: H0: S = 0, K = 3, H1: S ≠ 0, K ≠ 3.

Статистика (1) имеет распределение хи-квадрат с двумя степенями свободы, и, если вычисленное значение больше критического, нулевая гипотеза о нормальном распределении возмущений регрессионной модели не отклоняется. Тест Харке – Бера является асимптотическим тестом и применим к большим выборкам.

В обобщенной процедуре (multivariate) многомерного теста Харке – Бера, нормирование моментов выполняется при помощи матрицы факторизации P для оценки автоковариационной матрицы остатков модели VAR (p), представляющей собой нижнюю треугольную матрицу с положительными диагональными элементами (полученную при помощи разложения Холецкого), Bab07.wmf. Разложение можно также записать через верхнюю треугольную матрицу Bab08.wmf, где Bab09.wmf. Статистика обобщенного теста вычисляется по формуле [10]:

Bab10.wmf, (2)

где

Bab11.wmf,

Bab12.wmf, (3)

Bab13.wmf,

Bab14.wmf, Bab15.wmf.

Статистики (2), (3) реализованы в R при помощи функции normality.test() пакета {vars}: normality.test(x, multivariate.only = TRUE), с основными параметрами: x – объект класса "Varest", генерируемого VAR() или объект класса vec2var, генерируемого vec2var (); multivariate.only – логическая переменная, если TRUE (по умолчанию), вычисляется только статистика многомерного теста (2), если FALSE, вычисляются статистики для многомерного теста (2) и многомерных коэффициентов асимметрии и эксцесса (3). Объекты, созданные функциями с расширением test, поддерживают графическое представление эмпирического распределения остатков модели VAR(p) (и их квадратов), а также их автокорреляционной функции (ACF) и функции частных автокорреляций (PACF) [8].

Обобщенные тесты на автокорреляцию остатков

Для проверки адекватности моделей векторной авторегрессии, так же как и для моделей одномерных временных рядов, применяются тесты на отсутствие автокорреляции остатков, в частности обобщение тестов Бокса – Пирса (Box-Pierce Q-statistic) и Бокса – Льюинга (Ljung-Box Q-statistic), которые реализованы в эконометрических пакетах.

Для проверки нулевой гипотезы H0: ρ1 = ρ2 = ...= ρh = 0, против альтернативной Bab16.wmf, в тесте Бокса – Пирса используется статистика Q:

Bab17.wmf, (4)

где ρi) – теоретические значения коэффициентов корреляции, r(i) – выборочные коэффициенты корреляции с числовыми характеристиками: Bab18.wmf, Bab19.wmf, h – порядок автокорреляции, для которого выполнена нулевая предпосылка. Если уровни временного ряда – белый шум, то коэффициенты автокорреляции Bab20.wmf асимптотически независимы и при большом объеме наблюдений Bab21.wmf. Вычисленное по формуле (4) значение статистики сравнивается с критическим, и если Bab22.wmf, то нулевая гипотеза о белом шуме (отсутствии автокорреляции) отклоняется на уровне значимости α (правосторонняя критическая область). Обобщением статистики (4) для случая моделей VAR(p) является статистика теста Портманто (Portmanteau Test, (PT.asymptotic)):

Bab23.wmf, (5)

где

Bab24.wmf, Bab25.wmf (6)

– оценка автоковариационной матрицы остатков модели VAR(p), p – порядок модели векторной авторегрессии, h – порядок автокорреляции, для которого выполнена нулевая предпосылка, m – число эндогенных переменных модели. Статистика (5) используется для проверки нулевой гипотезы:

Bab26.wmf (7)

где Ri – автокорреляционная матрица, оценка которой вычисляется по формуле

Bab27.wmf (8)

где Bab28.wmf – диагональная матрица с диагональными элементами, равными стандартным ошибкам возмущений VAR(p)-процесса

Bab29.wmf

На малых выборках используют тест Бокса – Льюинга со статистикой

Bab30.wmf, (9)

в которую каждое слагаемое входит со своим весом Bab31.wmf.

Обобщенный (многомерный) вариант статистики (9) для моделей VAR(p) с учетом (5) принимает вид (PT.adjusted):

Bab32.wmf. (10)

Для тестирования автокорреляции используется также обобщенный вариант теста Бреуша – Годфри. Тест является асимптотическим, то есть для достоверности выводов требуется большой объём выборки. В тесте рассматривается авторегрессия остатков на их лаговые значения и оцениваются две модели: исходная модель VAR(p) (усечённая, с ограничениями, restricted)

Bab33.wmf, (11)

и вспомогательная, общая (неусеченная, без ограничений, unrestricted) модель

Bab34.wmfBab35.wmf, (12)

где et – остатки, полученные в результате МНК оценивания основной модели (11), et–j = 0 при t < j +1. Если нулевая гипотеза

Bab36.wmf

(против альтернативной Bab37.wmf для i = 1,2...,h) верна, то при большом значении объема выборки Т статистика теста определяется по формуле [8]:

Bab38.wmf, (13)

где ΩR – автоковариационная матрица вектора остатков исходной (усечённой) модели VAR(p) (11), ΩUR – автоковариационная матрица вектора остатков неусеченной модели (12), m – число эндогенных переменных модели, имеет хи-квадрат распределение с параметром hm2, и гипотеза не отклоняется при уровне значимости α, если выполняется неравенство

Bab39.wmf.

Тесты на проверку наличия автокорреляции реализованы в программной среде R при помощи функции serial.test() пакета{vars}:

serial.test (x, lags.pt, lags.bg, type = c("PT.asymptotic", "PT. adjusted", "BG")),

с основными аргументами: x – объект, генерируемый функцией VAR(); lags.pt – величина лага, используемая в статистике теста Портманто (5), lags.bg – величина лага, используемая в статистике теста Бреуша – Годфри (13); type – тип теста: PT.asymptotic – (5); PT.adjusted – (10); BG – Breusch-Godfrey – (13). По умолчанию используется асимптотический тест Портманто.

Обобщенные тесты на гетероскедастичность остатков

Для исследования гетероскедастичности в многомерных моделях временных рядов используются тесты ARCH, основанные на оценивании вспомогательной модели вида [10]:

Bab40.wmfBab41.wmf, (14)

где vt – процесс белого шума, vec(•) – оператор формирования вектора из нижней треугольной матрицы с элементами на главной диагонали и вертикальным выстраиванием её столбцов. Для реализации оператора vec(•) в программной среде используется функция lower.tri(x,diag=TRUE), пакета {base}, с основными параметрами: x – матрица, diag – логическая переменная: TRUE – включать элементы на главной диагонали, FALSE – не включать элементы на главной диагонали. Если размерность матрицы x – (m×m), то сформированный вектор имеет размерность – m(m + 1)/2.

Таким образом, размерность параметров в модели (14):

β0 – m(m + 1)/2, Bi – Bab42.wmf, i = 1,...,q.

Нулевая и альтернативная гипотезы формулируются следующим образом:

Bab43.wmf, Bab44.wmf,

и проверяются при помощи статистики

Bab45.wmf, (15)

с коэффициентом детерминации:

Bab46.wmf,

где Bab47.wmf – автоковариационная матрица вектора возмущений модели без ограничений на параметры, Bab48.wmf – с ограничениями на параметры в рамках гипотезы H0. Статистика (15) реализована в программной среде R в виде функции arch.test() пакета vars, которая вычисляет одномерные и многомерные тесты ARCH-LM для моделей VAR (p). Основные параметры функции:

arch.test(x, lags.single = 16, lags.multi = 5, multivariate.only = TRUE),

где x – объект класса "Varest", генерируется VAR () или vec2var(); lags.single – целое число, указывающее величину лага для одномерной статистики ARCH; lags.multi – целое число, указывающее величину лага для многомерной статистики ARCH; multivariate.only – Если TRUE (по умолчанию), вычисляется только статистика многомерного теста.

В таблице приведены скрипт и фрагмент протокола результатов оценивания и диагностики модели векторной авторегрессии VAR(1), оцененной для двух эндогенных переменных: объём инвестиций и величина капитала, по годовым данным фирмы «General Electric» за 20 лет, встроенным в пакет "AER".

Результаты оценки и диагностики модели VAR(p)

Фрагменты скрипта

Фрагменты протокола

#оценка модели VAR

library(tseries)

adf.test()

library(vars)

library("AER")

data("Grunfeld",package="AER")

Y<-GE$invest

X<-GE$capital

Dy<- diff(Y)

Dx<- diff(X)

#adf.test(Dy)

#adf.test(Dx)

varmat <- as.matrix(cbind(Dy,Dx))

varfit <- VAR(varmat,1,type="trend",ic="AIC")

summary(varfit)

Estimation results for equation Dy:

===================================

Dy = Dy.l1 + Dx.l1 + trend

Estimate Std.Error t value Pr(>|t|)

Dy.l1 -0.2328 0.2139 -1.089 0.29352

Dx.l1 -0.8288 0.2300 -3.603 0.00261 **

trend 3.8148 1.0155 3.757 0.00191 **

Residual standard error: 23.32 on 15 df

Multiple R-Squared: 0.5133, Adj R-squared: 0.416

F-statistic: 5.274 on 3 and 15 DF, p-value: 0.01104

Estimation results for equation Dx:

===================================

Dx = Dy.l1 + Dx.l1 + trend

Estimate Std. Error t value Pr(>|t|)

Dy.l1 0.95253 0.07516 12.674 2.04e-09 ***

Dx.l1 0.90503 0.08083 11.197 1.11e-08 ***

trend 0.07676 0.35684 0.215 0.833

Residual standard error: 8.193 on 15 df

Multiple R-Squared: 0.9809, Adj R-squared: 0.977

F-statistic: 256.4 on 3 and 15 DF, p-value: 4.166e-13

Окончание таблицы

Фрагменты скрипта

Фрагменты протокола

# диагностика:

 

# проверка на гетероскедастичность

arch.test(varfit, lags.single = 1, lags.multi=1,multivariate.only= TRUE)

ARCH (multivariate)

data: Residuals of VAR object varfit

Chi-squared = 10.866, df = 9, p-value = 0.285

# проверка на автокорреляцию

serial.test(varfit, lags.pt = 16, type = "PT.adjusted")

Portmanteau Test (adjusted)

data: Residuals of VAR object varfit

Chi-squared = 60.636, df = 60, p-value = 0.4527

# проверка на нормальность

var.norm<-normality.test(varfit, multivariate.only = TRUE)

JB-Test (multivariate)

data: Residuals of VAR object varfit

Chi-squared = 9.5024, df = 4, p-value = 0.0497

Skewness only (multivariate)

data: Residuals of VAR object varfit

Chi-squared = 5.9443, df = 2, p-value = 0.05119

Kurtosis only (multivariate)

data Residuals of VAR object varfit

Chi-squared = 3.5581, df = 2, p-value = 0.1688

 

Выводы

Как следует из протокола, остатки модели имеют нормальное распределение. Включение лаговых переменных в спецификацию Var(p) позволило преодолеть проблему автокорреляции, уточнить причинно-следственные связи и повысить качество модели.

С точки зрения образовательного процесса аппарат Var-моделей полностью соответствует принципу систематичности и последовательности обучения: новый учебный материал по построению и диагностике VAR (p) моделей базируется на знаниях ранее изученных эконометрических методов, расширяет и дополняет их.