Scientific journal
Fundamental research
ISSN 1812-7339
"Перечень" ВАК
ИФ РИНЦ = 1,674

METHOD OF EVALUATING LINKAGES AND RATIOSIN THE ECONOMY BY POLYNOMIAL REGRESSION MODELS

Adamadziev K.R. 1 Adamadzieva A.K. 1
1 Dagestan State University
Subject of research are the communications(connection) and dependences between socio economic parameters of regions. The task is formulated, according to which it is required to reveal dependence ВРП from number engaged in economy and cost of a fixed capital and the equations of regress as полинома of the second order, апробированные on the data 27 small regions of Russia on size ВРП for 2010 are constructed. Two different ways of definition of parameters and statistical characteristics многофакторных полиномиальных of the equations of regress with the help of various functions, procedures and means MS Excel are described. The author’s technique of account of parameters and characteristics двухфакторных of models of regress полиномиального of a kind and rating of results is given. Is developed and the computer model allowing to automate all necessary accounts and procedure of processing the information and to build as complete, and incomplete variants полиномиальных of the equations of regress is described. The comparative rating of various variants двухфакторных полиномов of the second order constructed on the data of small regions with the help of the key statistical characteristics is given and are determined most значимые from the equations.
method
ratio
economy
pattern-table
model
polynom
regression
parameters
statistical characteristics
1. Adamadziev K.R, Adamadzieva A.K. Evaluation of GRP ratio from investments, staff number in the economy and fixed capital cost by panel data models (through the example of regions of Russia) // International journal of applied and fundamental research. 2011. no. 9. pp. 68–70.
2. Lavrenov S.M. Excel: A collection of samples and tasks. M.: Finance and Statistics, 2008. 336 p.
3. Mathematical and computer simulation of regions’ economy. 20 Feb. 2011... 3d Student›s scientific forum (15 – February 20, 2011) rae.ru/forum2011/164 < http: // www.rae.ru/forum2011/164>/
4. Practical work on econometrics. Edited by Yeliseeva I.I. – 2nd edition, rev. and suppl. – M.: Finance and Statistics, 2008. – 344 p.
5. Russia in figures, 2011: Brief Statistical Handbook / Rosstat. – М., 2011. – 581 p.
6. Econometrics: Handbook: diagrams and tables. Edited by D.Sc. (Economics), Prof. Orekhov S.А. – M.: Eksmo, 2008. – 224 p.

Важнейшими функциями, выполняемыми на любых экономических объектах, являются аналитические функции, которые, как правило, выполняются работниками среднего и высшего уровня управления. При проведении анализа часто возникает необходимость в проведении множества расчётов и процедур обработки информации. Для автоматизации расчётов и процедур обработки информации в настоящее время разработаны и применяются так называемые BI-системы (аналитические системы подготовки принятия решений).

К числу наиболее значимых задач для BI-систем можно отнести задачи, в которых требуется количественно выразить и оценить связи и зависимости между различными экономическими показателями и тенденции их изменения.

Особенность таких задач состоит в том, что связи, зависимости и тенденции носят неопределённый, вероятностный характер для любого из выбранных совокупностей и поэтому не могут быть однозначно определены. Во-первых, зависимость даже между одними и теми же показателями для одной и той же совокупности может быть описана разными видами уравнений регрессии (как линейными, так и нелинейными); во-вторых, удаление любого из объектов совокупности или добавление нового объекта в состав исследуемой совокупности может изменить степень тесноты связи и её характеристики.

Содержание

Связи и зависимости между экономическими показателями могут быть описаны одно- и многофакторными моделями регрессии. Особое место среди видов моделей регрессии занимают модели, описываемые полиномами второго порядка. Уже однофакторная модель такого вида, записываемая в виде уравнения параболы, отличается от остальных однофакторных тем, что, во-первых, она содержит три параметра (а не два, как, например, линейное, показательное и степенное); во-вторых, на ее основе можно определить величину показателя-фактора, при котором результативный показатель принимает максимальное (или минимальное) значение.

Так, если однофакторное уравнение параболы записать в виде

y = b + m1x + m2x2,

то при adamaz01.wmf y принимает max или min.

При этом сама величина ymax (ymin) равна

adamaz02.wmf.

Т.о., точка max (min) – это вершина параболы, координаты которой равны adamaz03.wmf.

Двухфакторная полиномиальная модель регрессии параболического вида в общем случае представляет собой уравнение, которое имеет следующую математическую запись:

adamaz04.wmf.(1)

Методика расчёта параметров этого уравнения аналогична методике построения пятифакторного уравнения линейного вида:

adamaz05.wmf. (2)

Параметры уравнения (1) можно рассчитать методом наименьших квадратов, в соответствии с которым требуется составить и решить систему нормальных уравнений [4, 6].

Поскольку с помощью уравнений регрессии выявляются и оцениваются приближенные траектории связей и зависимостей, называемые корреляционными, то для обоснования их адекватности и возможности практического применения принято рассчитывать статистические характеристики.

На основе учебной литературы по эконометрике [2, 4, 6] нами разработан модельный инструментарий, включающий комплекс из 20 формул.

Особенности построения двухфакторных уравнений параболического вида (см. формулу (1)) и методика оценки связей и зависимостей с их помощью рассмотрим на конкретном практическом примере.

Пусть требуется построить двухфакторное уравнение регрессии для зависимости ВРП (y, млрд руб.) от численности занятых в экономике (х1, тыс. чел.) и стоимости основных фондов (х2, млрд руб.) для 27 малых регионов России по величине ВРП за 2010 г.

Для формирования выборки из 27 малых регионов достаточно создать в MS Excel таблицу с тремя рассматриваемыми показателями для всех регионов России [5], расположить регионы в порядке возрастания величины ВРП, а затем выбрать требуемые 27 регионов (табл. 1).

Таблица 1

Исходные данные по 27 малым регионам России за 2010 г. (фрагмент)

 

2010

ВРП, млрд руб.

Число, тыс. чел.

ОФ, млрд руб.

Y

Х1

Х2

1

Республика Ингушетия

18,7

65,5

41

2

Республика Алтай

19,9

94,9

45

27

Астраханская область

132,2

446,3

530

 

Сумма

1994,9

7399,7

5987

Чтобы рассчитать параметры уравнения с помощью системы нормальных уравнений требуется создать таблицу-шаблон (табл. 2) с исходными данными, предусматривающую выполнение всех необходимых промежуточных расчётов.

В строке «сумма» таблицы-шаблона 2 содержатся все величины (⅀y, ⅀x1, ⅀x2, …, ⅀(x1x2)2, ⅀x1x2y), необходимые для расчета параметров уравнений путем построения и решения системы нормальных уравнений.

Для выполнения промежуточных расчётов по таблице-шаблону (табл. 2) требуется:

а) ввести исходные значения y, x1, x2, в столбцы 2, 3 и 4;

б) в ячейки первой строки столбцов 6,7,…22 ввести с клавиатуры формулы: « = x12» , « = x22», « = x1x2,…», …, « = x1x2y» (см. выражения в столбцах табл. 2);

в) копировать формулы, введённые в ячейки первой строки, в ячейки всех остальных строк (кроме строки «сумма»);

г) в ячейку 2-го столбца строки «сумма» ввести формулу « = сумм» и скопировать её в остальные ячейки этой строки.

Подставив суммы из табл. 2 в систему нормальных уравнений, получим численную модель этой системы, содержащую шесть уравнений и шесть переменных, параметры которых можно рассчитать в MS Excel двумя способами:

а) с помощью процедуры «Поиск решения…»;

б) с помощью встроенной статистической функции «ЛИНЕЙН».

Таблица 2

Фрагмент таблицы-шаблона для расчета суммарных, средних и других промежуточных величин, необходимых для расчета параметров и статистических характеристик 2-факторных уравнений регрессии параболического вида

 

y

x1

x2

adamaz06.wmf

adamaz07.wmf

x1x2

x3

1

2

3

4

5

6

7

8

1

18,7

65,5

41

4290

1681

2686

281011

 

27

132,2

446,3

530

199184

280900

236539

88895681

Сумма

1994,9

7399,7

5987

2607600,97

1794703

2094928

1039745842

Продолжение табл. 2

adamaz08.wmf

adamaz09.wmf

yx1

adamaz10.wmf

yx2

adamaz11.wmf

adamaz12.wmf

9

10

11

12

13

14

15

185087346

175900

1225

68921

767

18406245

7211910

3,522E + 13

1,056E + 08

5,900E + 04

1,489E + 08

7,007E + 04

3,967E + 10

5,595E + 10

1,065E + 14

8,304E + 08

6,682E + 05

6,338E + 08

5,584E + 05

4,469E + 11

2,967E + 11

Окончание табл. 2

adamaz13.wmf

adamaz14.wmf

adamaz15.wmf

adamaz16.wmf

adamaz17.wmf

adamaz18.wmf

16

17

18

19

20

21

11521466

80228

2825761

4514326

31435

50219

4,711E + 10

2,633E + 07

7,890E + 10

6,644E + 10

3,713E + 07

3,127E + 07

3,531E + 11

2,592E + 08

2,476E + 11

2,642E + 11

1,883E + 08

2,145E + 08

Рассмотрим методику расчета параметров каждым способом. При применении первого способа создается пустая таблица-шаблон вида табл. 3 и в ее ячейки вводятся численные значения необходимых сумм из таблицы-шаблона 2. Ввод данных можно выполнить с клавиатуры, но лучше с помощью операторов присвоения, связывающих ячейки строки «сумма» и ячейки таблицы-шаблона 3. Это позволяет впоследствии автоматизировать все расчетные операции и процедуры обработки информации с помощью единой компьютерной модели.

При применении первого способа параметры уравнения выводятся в строку «решение» созданной таблицы-шаблона (табл. 3).

Mетодика расчета параметров с помощью процедуры «Поиск решения…» включает следующую последовательность действий:

– в рабочем окне MS Excel создается исходная таблица (которую принято называть расширенной моделью или числовой моделью решаемой задачи) в виде вышеприведенной табл. 3;

– в первую ячейку столбца «Расчетные выражения» вводится расчетное выражение, позволяющее перемножить элементы 1-й строки на элементы строки «решение» (используя встроенную математическую функцию «СУММПРОИЗВ» из MS Excel);

– аналогичные расчетные выражения вводятся (копируются) во все строки столбца «Расчетные выражения», включая строку «целевая функция»;

– установив курсор на ячейку на пересечении строки «целевая функция» и столбца «расчетные выражения», запускается процедура «Поиск решения…» и в появившемся окне выполняются предусмотренные действия: выбор целевой ячейки; указание адресов ячеек, в которые выводится решение; ввод ограничений; нажатие кнопки «выполнить»; (после вывода сообщения «задача решена») нажатие клавиши «ОК».

Таблица 3

Таблица-шаблон для расчёта параметров двухфакторных уравнений регрессии параболического вида с помощью процедуры «Поиск решений…»

 

b

m1

m2

m3

m4

m5

Расчётные выражения

Величины ограничений

1.

n

adamaz20.wmf

adamaz21.wmf

adamaz22.wmf

adamaz23.wmf

adamaz24.wmf

 

adamaz25.wmf

2.

adamaz26.wmf

adamaz27.wmf

adamaz28.wmf

adamaz29.wmf

adamaz30.wmf

adamaz31.wmf

 

adamaz32.wmf

3.

adamaz33.wmf

adamaz34.wmf

adamaz35.wmf

adamaz36.wmf

adamaz37.wmf

adamaz38.wmf

 

adamaz39.wmf

4.

adamaz40.wmf

adamaz41.wmf

adamaz42.wmf

adamaz43.wmf

adamaz44.wmf

adamaz45.wmf

 

adamaz46.wmf

5.

adamaz47.wmf

adamaz48.wmf

adamaz49.wmf

adamaz50.wmf

adamaz51.wmf

adamaz52.wmf

 

adamaz53.wmf

6.

adamaz54.wmf

adamaz55.wmf

adamaz56.wmf

adamaz57.wmf

adamaz58.wmf

adamaz59.wmf

 

adamaz60.wmf

Целевая функция

0

0

0

0

0

0

   

Решение

0

0

0

0

0

0

   

Результаты расчетов с помощью процедуры «Поиск решения…» выводятся в ячейки строки «решение» табл. 3.

По данным табл. 3 можно рассчитывать параметры не только двухфакторных моделей регрессии для полного полинома, но и следующих частных вариантов полиномов:

2) у = b + m1x1 + m2x2 + m3x12;

3) у = b + m1x1 + m2x2 + m4x22;

4) у = b + m1x1 + m2x2 + m5x1х2;

5) у = b + m1x1 + m2x2 + m3x12 + m4x22;

6) у = b + m1x1 + m2x2 + m3x12 + m5x1х2;

7) у = b + m1x1 + m2x2 + m4x22 + m5x1х2.

Для аналитических целей параметры, рассчитанные по уравнениям регрессии всех семи видов, целесообразно свести в табл. 4.

Таблица 4

Величины параметров двухфакторного полиномиального уравнения регрессии для зависимости ВРП от численности занятых в экономике и стоимости основных фондов, построенного по данным 27 малых регионов России за 2010 г.

Решения

b

m1

m2

m3

m4

m5

1-й вар-т

4,6174

0,0120

0,3770

0,000196

–0,000052

–0,000426

2-й вар-т

9,7906

0,1172

0,1849

–0,000093

   

3-й вар-т

5,4463

0,0349

0,3402

 

–0,000249

 

4-й вар-т

4,5672

0,0996

0,2696

   

–0,000229

5-й вар-т

5,7635

0,0279

0,3450

0,000011

–0,000256

 

6-й вар-т

4,4483

0,0103

0,3807

0,000235

 

–0,000522

7-й вар-т

5,2610

0,0378

0,3388

 

–0,000240

–0,000012

Как было отмечено выше, для оценки приемлемости построенных уравнений регрессии следует рассчитать ряд статистических характеристик.

В табл. 5 приведены данные, иллюстрирующие методику расчета двух наиболее значимых из статистических характеристик: коэффициента детерминации (R) и средней ошибки аппроксимации (А). Эта же таблица иллюстрирует промежуточные расчеты, которые для этого требуется выполнить (определить для каждого из уравнений регрессии расчетные значения (уx), а также

∑(у – уx)2 и ∑(у – уср)2).

Рассмотрим методику расчета параметров и статистических характеристик для двухфакторного полинома с помощью встроенной статистической функции «ЛИНЕЙН» (т.е. вторым способом).

В этом случае величины параметров и ряд дополнительных статистических характеристик рассчитываются и выводятся в виде следующей таблицы-шаблона, первая строка которой содержит величины параметров, вторая строка – их стандартные ошибки, остальные три – содержат шесть статистических характеристик. Их сущность и методику расчета см., например, в [2].

Таблица 5

Фрагмент таблицы, иллюстрирующей методику расчета статистических характеристик (индекса корреляции и средней ошибки аппроксимации) для двухфакторных полиномиальных моделей регрессии

2010

ВРП, млрд руб.

Числ, тыс. чел.

ОФ, млрд руб.

 

Y

Х1

Х2

(Y – Yср)2

1

2

3

4

Республика Ингушетия

18,7

65,5

41

3045,4

Астраханская область

132,2

446,3

530

3400,6

Среднее значение

73,9

274,1

222

1256,0

R

       

A

       

Продолжение табл. 5

1-й вариант

2-й вариант

 

7-й вариант

     

(Y – Yx)2

(Y – Yx)2

(Y – Yx)2

5

6

7

8

17

18

20,5

3,1

24,6

35,4

21,5

8,0

133,4

1,5

141,5

85,9

1994,9

4208,6

73,9

150,234

73,9

164,196

1994,9

4208,6

0,93829

 

0,9323

0,93829

 

0,9359

 

16,6

 

17,3

   

16,9

 

Окончание табл. 5

m5

m4

m3

m2

m1

b

se5

se4

se3

se2

se1

seb

r2

sey

       

F

df

       

SSresid

SSreg

       

Особенность этой методики состоит в том, что для расчетных значений создается таблица–шаблон в виде таблицы 6. При этом количество столбцов в таблице равно числу параметров уравнения, а количество строк равно пяти. В частности, для расчета параметров и характеристик полного полинома 1 создается таблица-шаблон размерности 6×5 (см. табл. 6).

Таким образом, чтобы рассчитать параметры и статистические характеристики полиномиальной модели вторым способом требуется:

– создать таблицу-шаблон (табл. 6);

– активировать процедуру «Мастер функции…», в первом его окне выбрать категорию «статистические», а затем (во втором окне «Мастера функции») – встроенную функцию «ЛИНЕЙН»;

– выполнить во 2-м окне предусмотренные в нем действия, а именно: выбор «известных значений у», выбор «известных значений х», конст., статистика – и нажать клавишу «ОК»;

– нажать комбинацию клавиш Shift + Ctrl + Enter.

В таком виде таблица 6 неудобна для анализа. Поэтому на её основе целесообразно создать одну или несколько аналитических таблиц-шаблонов. В частности, для сравнительной оценки ключевых статистических характеристик двухфакторных полиномов второго порядка нами создана аналитическая табл. 7.

Таблица 6

Величины параметров и статистических характеристик для двухфакторных уравнений регрессии полиномиального вида для зависимости ВРП от численности занятых в экономике и стоимости основных фондов, построенных по данным 27 малых регионов России по данным за 2010 г.

–0,00043

–0,00005

0,00020

0,3769

0,0120

4,6178

0,00113

0,00058

0,00051

0,1522

0,1127

9,9958

0,88039

13,8981

#Н/Д

#Н/Д

#Н/Д

#Н/Д

30,9

21

#Н/Д

#Н/Д

#Н/Д

#Н/Д

29855,8

4056,3

#Н/Д

#Н/Д

#Н/Д

#Н/Д

Таблица 7

Величины ключевых статистических характеристик различных вариантов двухфакторных полиномов второго порядка, выражающих зависимость ВРП от численности занятых в экономике и стоимости основных фондов по данным 27 малых регионов России за 2010 г.

 

1

2

3

4

5

6

7

sey

13,898

13,884

13,624

13,581

13,326

13,625

13,527

r2

0,8804

0,8693

0,8796

0,8803

0,8796

0,8796

0,8759

F

30,9

51,0

40,2

40,5

56,0

40,2

54,1

А

18,8

18,8

18,4

18,4

18,0

18,4

18,3

Как видно из табл. 7, практически все семь вариантов полиномов второго порядка оказались приемлемыми для оценки исследуемой зависимости, поскольку минимальные и максимальные значения величин трех статистических характеристик различаются по вариантам весьма незначительно: от 13,3 до 13,9 (sey), от 0,8796 до 0,8804 (r2), от 18,0 до 18,8 (A).

Ниже приведены три наиболее значимых из построенных нами вариантов полиномиальных уравнений регрессии:

а) adamaz61.wmf – полный полином 2-го порядка (1 вариант);

б) adamaz62.wmf – вариант, наиболее близкий к полному полиному (5-й вариант);

в) adamaz63.wmf. – наиболее приемлемый вариант по статистическим характеристикам (6-й вариант).

Все операции, связанные с выполнением расчетов и процедурами обработки информации, нами сведены в единую компьютерную модель, которая апробирована на примере 27 средних и 25 крупных регионов России за 2010 г.

Рецензенты:

Кутаев Ш.К., д.э.н., зав. отделом Воспроизводства населения и трудовых ресурсов Института социально-экономических исследований Дагестанского научного центра, г. Махачкала;

Алиев М.А., д.э.н., профессор кафедры экономической теории, ФГБОУ ВПО «Дагестанский государственный педагогический университет», г. Махачкала.

Работа поступила в редакцию 23.03.2014.