Важнейшими функциями, выполняемыми на любых экономических объектах, являются аналитические функции, которые, как правило, выполняются работниками среднего и высшего уровня управления. При проведении анализа часто возникает необходимость в проведении множества расчётов и процедур обработки информации. Для автоматизации расчётов и процедур обработки информации в настоящее время разработаны и применяются так называемые BI-системы (аналитические системы подготовки принятия решений).
К числу наиболее значимых задач для BI-систем можно отнести задачи, в которых требуется количественно выразить и оценить связи и зависимости между различными экономическими показателями и тенденции их изменения.
Особенность таких задач состоит в том, что связи, зависимости и тенденции носят неопределённый, вероятностный характер для любого из выбранных совокупностей и поэтому не могут быть однозначно определены. Во-первых, зависимость даже между одними и теми же показателями для одной и той же совокупности может быть описана разными видами уравнений регрессии (как линейными, так и нелинейными); во-вторых, удаление любого из объектов совокупности или добавление нового объекта в состав исследуемой совокупности может изменить степень тесноты связи и её характеристики.
Содержание
Связи и зависимости между экономическими показателями могут быть описаны одно- и многофакторными моделями регрессии. Особое место среди видов моделей регрессии занимают модели, описываемые полиномами второго порядка. Уже однофакторная модель такого вида, записываемая в виде уравнения параболы, отличается от остальных однофакторных тем, что, во-первых, она содержит три параметра (а не два, как, например, линейное, показательное и степенное); во-вторых, на ее основе можно определить величину показателя-фактора, при котором результативный показатель принимает максимальное (или минимальное) значение.
Так, если однофакторное уравнение параболы записать в виде
y = b + m1x + m2x2,
то при y принимает max или min.
При этом сама величина ymax (ymin) равна
.
Т.о., точка max (min) – это вершина параболы, координаты которой равны .
Двухфакторная полиномиальная модель регрессии параболического вида в общем случае представляет собой уравнение, которое имеет следующую математическую запись:
.(1)
Методика расчёта параметров этого уравнения аналогична методике построения пятифакторного уравнения линейного вида:
. (2)
Параметры уравнения (1) можно рассчитать методом наименьших квадратов, в соответствии с которым требуется составить и решить систему нормальных уравнений [4, 6].
Поскольку с помощью уравнений регрессии выявляются и оцениваются приближенные траектории связей и зависимостей, называемые корреляционными, то для обоснования их адекватности и возможности практического применения принято рассчитывать статистические характеристики.
На основе учебной литературы по эконометрике [2, 4, 6] нами разработан модельный инструментарий, включающий комплекс из 20 формул.
Особенности построения двухфакторных уравнений параболического вида (см. формулу (1)) и методика оценки связей и зависимостей с их помощью рассмотрим на конкретном практическом примере.
Пусть требуется построить двухфакторное уравнение регрессии для зависимости ВРП (y, млрд руб.) от численности занятых в экономике (х1, тыс. чел.) и стоимости основных фондов (х2, млрд руб.) для 27 малых регионов России по величине ВРП за 2010 г.
Для формирования выборки из 27 малых регионов достаточно создать в MS Excel таблицу с тремя рассматриваемыми показателями для всех регионов России [5], расположить регионы в порядке возрастания величины ВРП, а затем выбрать требуемые 27 регионов (табл. 1).
Таблица 1
Исходные данные по 27 малым регионам России за 2010 г. (фрагмент)
2010 |
ВРП, млрд руб. |
Число, тыс. чел. |
ОФ, млрд руб. |
|
Y |
Х1 |
Х2 |
||
1 |
Республика Ингушетия |
18,7 |
65,5 |
41 |
2 |
Республика Алтай |
19,9 |
94,9 |
45 |
… |
… |
… |
… |
… |
27 |
Астраханская область |
132,2 |
446,3 |
530 |
Сумма |
1994,9 |
7399,7 |
5987 |
Чтобы рассчитать параметры уравнения с помощью системы нормальных уравнений требуется создать таблицу-шаблон (табл. 2) с исходными данными, предусматривающую выполнение всех необходимых промежуточных расчётов.
В строке «сумма» таблицы-шаблона 2 содержатся все величины (⅀y, ⅀x1, ⅀x2, …, ⅀(x1x2)2, ⅀x1x2y), необходимые для расчета параметров уравнений путем построения и решения системы нормальных уравнений.
Для выполнения промежуточных расчётов по таблице-шаблону (табл. 2) требуется:
а) ввести исходные значения y, x1, x2, в столбцы 2, 3 и 4;
б) в ячейки первой строки столбцов 6,7,…22 ввести с клавиатуры формулы: « = x12» , « = x22», « = x1x2,…», …, « = x1x2y» (см. выражения в столбцах табл. 2);
в) копировать формулы, введённые в ячейки первой строки, в ячейки всех остальных строк (кроме строки «сумма»);
г) в ячейку 2-го столбца строки «сумма» ввести формулу « = сумм» и скопировать её в остальные ячейки этой строки.
Подставив суммы из табл. 2 в систему нормальных уравнений, получим численную модель этой системы, содержащую шесть уравнений и шесть переменных, параметры которых можно рассчитать в MS Excel двумя способами:
а) с помощью процедуры «Поиск решения…»;
б) с помощью встроенной статистической функции «ЛИНЕЙН».
Таблица 2
Фрагмент таблицы-шаблона для расчета суммарных, средних и других промежуточных величин, необходимых для расчета параметров и статистических характеристик 2-факторных уравнений регрессии параболического вида
y |
x1 |
x2 |
|
|
x1x2 |
x3 |
|
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
1 |
18,7 |
65,5 |
41 |
4290 |
1681 |
2686 |
281011 |
… |
… |
… |
… |
… |
… |
… |
|
27 |
132,2 |
446,3 |
530 |
199184 |
280900 |
236539 |
88895681 |
Сумма |
1994,9 |
7399,7 |
5987 |
2607600,97 |
1794703 |
2094928 |
1039745842 |
Продолжение табл. 2
|
|
yx1 |
|
yx2 |
|
|
9 |
10 |
11 |
12 |
13 |
14 |
15 |
185087346 |
175900 |
1225 |
68921 |
767 |
18406245 |
7211910 |
… |
… |
… |
… |
… |
… |
… |
3,522E + 13 |
1,056E + 08 |
5,900E + 04 |
1,489E + 08 |
7,007E + 04 |
3,967E + 10 |
5,595E + 10 |
1,065E + 14 |
8,304E + 08 |
6,682E + 05 |
6,338E + 08 |
5,584E + 05 |
4,469E + 11 |
2,967E + 11 |
Окончание табл. 2
|
|
|
|
|
|
16 |
17 |
18 |
19 |
20 |
21 |
11521466 |
80228 |
2825761 |
4514326 |
31435 |
50219 |
… |
… |
… |
… |
… |
… |
4,711E + 10 |
2,633E + 07 |
7,890E + 10 |
6,644E + 10 |
3,713E + 07 |
3,127E + 07 |
3,531E + 11 |
2,592E + 08 |
2,476E + 11 |
2,642E + 11 |
1,883E + 08 |
2,145E + 08 |
Рассмотрим методику расчета параметров каждым способом. При применении первого способа создается пустая таблица-шаблон вида табл. 3 и в ее ячейки вводятся численные значения необходимых сумм из таблицы-шаблона 2. Ввод данных можно выполнить с клавиатуры, но лучше с помощью операторов присвоения, связывающих ячейки строки «сумма» и ячейки таблицы-шаблона 3. Это позволяет впоследствии автоматизировать все расчетные операции и процедуры обработки информации с помощью единой компьютерной модели.
При применении первого способа параметры уравнения выводятся в строку «решение» созданной таблицы-шаблона (табл. 3).
Mетодика расчета параметров с помощью процедуры «Поиск решения…» включает следующую последовательность действий:
– в рабочем окне MS Excel создается исходная таблица (которую принято называть расширенной моделью или числовой моделью решаемой задачи) в виде вышеприведенной табл. 3;
– в первую ячейку столбца «Расчетные выражения» вводится расчетное выражение, позволяющее перемножить элементы 1-й строки на элементы строки «решение» (используя встроенную математическую функцию «СУММПРОИЗВ» из MS Excel);
– аналогичные расчетные выражения вводятся (копируются) во все строки столбца «Расчетные выражения», включая строку «целевая функция»;
– установив курсор на ячейку на пересечении строки «целевая функция» и столбца «расчетные выражения», запускается процедура «Поиск решения…» и в появившемся окне выполняются предусмотренные действия: выбор целевой ячейки; указание адресов ячеек, в которые выводится решение; ввод ограничений; нажатие кнопки «выполнить»; (после вывода сообщения «задача решена») нажатие клавиши «ОК».
Таблица 3
Таблица-шаблон для расчёта параметров двухфакторных уравнений регрессии параболического вида с помощью процедуры «Поиск решений…»
b |
m1 |
m2 |
m3 |
m4 |
m5 |
Расчётные выражения |
Величины ограничений |
|
1. |
n |
|
|
|
|
|
|
|
2. |
|
|
|
|
|
|
|
|
3. |
|
|
|
|
|
|
|
|
4. |
|
|
|
|
|
|
|
|
5. |
|
|
|
|
|
|
|
|
6. |
|
|
|
|
|
|
|
|
Целевая функция |
0 |
0 |
0 |
0 |
0 |
0 |
||
Решение |
0 |
0 |
0 |
0 |
0 |
0 |
Результаты расчетов с помощью процедуры «Поиск решения…» выводятся в ячейки строки «решение» табл. 3.
По данным табл. 3 можно рассчитывать параметры не только двухфакторных моделей регрессии для полного полинома, но и следующих частных вариантов полиномов:
2) у = b + m1x1 + m2x2 + m3x12;
3) у = b + m1x1 + m2x2 + m4x22;
4) у = b + m1x1 + m2x2 + m5x1х2;
5) у = b + m1x1 + m2x2 + m3x12 + m4x22;
6) у = b + m1x1 + m2x2 + m3x12 + m5x1х2;
7) у = b + m1x1 + m2x2 + m4x22 + m5x1х2.
Для аналитических целей параметры, рассчитанные по уравнениям регрессии всех семи видов, целесообразно свести в табл. 4.
Таблица 4
Величины параметров двухфакторного полиномиального уравнения регрессии для зависимости ВРП от численности занятых в экономике и стоимости основных фондов, построенного по данным 27 малых регионов России за 2010 г.
Решения |
b |
m1 |
m2 |
m3 |
m4 |
m5 |
1-й вар-т |
4,6174 |
0,0120 |
0,3770 |
0,000196 |
–0,000052 |
–0,000426 |
2-й вар-т |
9,7906 |
0,1172 |
0,1849 |
–0,000093 |
||
3-й вар-т |
5,4463 |
0,0349 |
0,3402 |
–0,000249 |
||
4-й вар-т |
4,5672 |
0,0996 |
0,2696 |
–0,000229 |
||
5-й вар-т |
5,7635 |
0,0279 |
0,3450 |
0,000011 |
–0,000256 |
|
6-й вар-т |
4,4483 |
0,0103 |
0,3807 |
0,000235 |
–0,000522 |
|
7-й вар-т |
5,2610 |
0,0378 |
0,3388 |
–0,000240 |
–0,000012 |
Как было отмечено выше, для оценки приемлемости построенных уравнений регрессии следует рассчитать ряд статистических характеристик.
В табл. 5 приведены данные, иллюстрирующие методику расчета двух наиболее значимых из статистических характеристик: коэффициента детерминации (R) и средней ошибки аппроксимации (А). Эта же таблица иллюстрирует промежуточные расчеты, которые для этого требуется выполнить (определить для каждого из уравнений регрессии расчетные значения (уx), а также
∑(у – уx)2 и ∑(у – уср)2).
Рассмотрим методику расчета параметров и статистических характеристик для двухфакторного полинома с помощью встроенной статистической функции «ЛИНЕЙН» (т.е. вторым способом).
В этом случае величины параметров и ряд дополнительных статистических характеристик рассчитываются и выводятся в виде следующей таблицы-шаблона, первая строка которой содержит величины параметров, вторая строка – их стандартные ошибки, остальные три – содержат шесть статистических характеристик. Их сущность и методику расчета см., например, в [2].
Таблица 5
Фрагмент таблицы, иллюстрирующей методику расчета статистических характеристик (индекса корреляции и средней ошибки аппроксимации) для двухфакторных полиномиальных моделей регрессии
2010 |
ВРП, млрд руб. |
Числ, тыс. чел. |
ОФ, млрд руб. |
|
Y |
Х1 |
Х2 |
(Y – Yср)2 |
|
1 |
2 |
3 |
4 |
|
Республика Ингушетия |
18,7 |
65,5 |
41 |
3045,4 |
… |
… |
… |
… |
… |
Астраханская область |
132,2 |
446,3 |
530 |
3400,6 |
Среднее значение |
73,9 |
274,1 |
222 |
1256,0 |
R |
||||
A |
Продолжение табл. 5
1-й вариант |
2-й вариант |
7-й вариант |
||||
Yх |
(Y – Yx)2 |
Yх |
(Y – Yx)2 |
… |
Yх |
(Y – Yx)2 |
5 |
6 |
7 |
8 |
… |
17 |
18 |
20,5 |
3,1 |
24,6 |
35,4 |
… |
21,5 |
8,0 |
… |
… |
… |
… |
… |
… |
… |
133,4 |
1,5 |
141,5 |
85,9 |
… |
1994,9 |
4208,6 |
73,9 |
150,234 |
73,9 |
164,196 |
… |
1994,9 |
4208,6 |
0,93829 |
0,9323 |
0,93829 |
0,9359 |
|||
16,6 |
17,3 |
16,9 |
Окончание табл. 5
m5 |
m4 |
m3 |
m2 |
m1 |
b |
se5 |
se4 |
se3 |
se2 |
se1 |
seb |
r2 |
sey |
||||
F |
df |
||||
SSresid |
SSreg |
Особенность этой методики состоит в том, что для расчетных значений создается таблица–шаблон в виде таблицы 6. При этом количество столбцов в таблице равно числу параметров уравнения, а количество строк равно пяти. В частности, для расчета параметров и характеристик полного полинома 1 создается таблица-шаблон размерности 6×5 (см. табл. 6).
Таким образом, чтобы рассчитать параметры и статистические характеристики полиномиальной модели вторым способом требуется:
– создать таблицу-шаблон (табл. 6);
– активировать процедуру «Мастер функции…», в первом его окне выбрать категорию «статистические», а затем (во втором окне «Мастера функции») – встроенную функцию «ЛИНЕЙН»;
– выполнить во 2-м окне предусмотренные в нем действия, а именно: выбор «известных значений у», выбор «известных значений х», конст., статистика – и нажать клавишу «ОК»;
– нажать комбинацию клавиш Shift + Ctrl + Enter.
В таком виде таблица 6 неудобна для анализа. Поэтому на её основе целесообразно создать одну или несколько аналитических таблиц-шаблонов. В частности, для сравнительной оценки ключевых статистических характеристик двухфакторных полиномов второго порядка нами создана аналитическая табл. 7.
Таблица 6
Величины параметров и статистических характеристик для двухфакторных уравнений регрессии полиномиального вида для зависимости ВРП от численности занятых в экономике и стоимости основных фондов, построенных по данным 27 малых регионов России по данным за 2010 г.
–0,00043 |
–0,00005 |
0,00020 |
0,3769 |
0,0120 |
4,6178 |
0,00113 |
0,00058 |
0,00051 |
0,1522 |
0,1127 |
9,9958 |
0,88039 |
13,8981 |
#Н/Д |
#Н/Д |
#Н/Д |
#Н/Д |
30,9 |
21 |
#Н/Д |
#Н/Д |
#Н/Д |
#Н/Д |
29855,8 |
4056,3 |
#Н/Д |
#Н/Д |
#Н/Д |
#Н/Д |
Таблица 7
Величины ключевых статистических характеристик различных вариантов двухфакторных полиномов второго порядка, выражающих зависимость ВРП от численности занятых в экономике и стоимости основных фондов по данным 27 малых регионов России за 2010 г.
1 |
2 |
3 |
4 |
5 |
6 |
7 |
|
sey |
13,898 |
13,884 |
13,624 |
13,581 |
13,326 |
13,625 |
13,527 |
r2 |
0,8804 |
0,8693 |
0,8796 |
0,8803 |
0,8796 |
0,8796 |
0,8759 |
F |
30,9 |
51,0 |
40,2 |
40,5 |
56,0 |
40,2 |
54,1 |
А |
18,8 |
18,8 |
18,4 |
18,4 |
18,0 |
18,4 |
18,3 |
Как видно из табл. 7, практически все семь вариантов полиномов второго порядка оказались приемлемыми для оценки исследуемой зависимости, поскольку минимальные и максимальные значения величин трех статистических характеристик различаются по вариантам весьма незначительно: от 13,3 до 13,9 (sey), от 0,8796 до 0,8804 (r2), от 18,0 до 18,8 (A).
Ниже приведены три наиболее значимых из построенных нами вариантов полиномиальных уравнений регрессии:
а) – полный полином 2-го порядка (1 вариант);
б) – вариант, наиболее близкий к полному полиному (5-й вариант);
в) . – наиболее приемлемый вариант по статистическим характеристикам (6-й вариант).
Все операции, связанные с выполнением расчетов и процедурами обработки информации, нами сведены в единую компьютерную модель, которая апробирована на примере 27 средних и 25 крупных регионов России за 2010 г.
Рецензенты:
Кутаев Ш.К., д.э.н., зав. отделом Воспроизводства населения и трудовых ресурсов Института социально-экономических исследований Дагестанского научного центра, г. Махачкала;
Алиев М.А., д.э.н., профессор кафедры экономической теории, ФГБОУ ВПО «Дагестанский государственный педагогический университет», г. Махачкала.
Работа поступила в редакцию 23.03.2014.