THE CHOICE OF ASSESSMENT METHOD OF THE MATRIX OF LOADINGS IN FACTOR ANALYSIS AND ALGORITHM EVALUATION IN THE ABSENCE OF SOME SPECIFIC FACTORS

1. Пусть x₁, x₂, …, x_p – p наблюдаемых признаков, orlova01.wmf – результаты i-го наблюдения признаков, i = 1, 2, …, n, Х = (x_ij) – матрица наблюдений (исходных данных). В факторном анализе предполагается, что x_j является линейной комбинацией m линейно независимых факторов, так называемых «общих факторов» f₁, f₂, …, f_m, плюс «специфический» для данного признака фактор e_i, некоррелированный ни с общими факторами, ни с другими специфическими факторами,

orlova02.wmf (1)

Будем считать x_iцентрированными, а факторы – ортогональными:

M(x_i) = 0; M(f_j) = 0;

M(e_i) = 0; σ²(f_j) = 1;

σ²(e_i) = v_i; cov(f_i, f_j) = 0.

Общие факторы f_j являются «причиной» корреляций между признаками x_i. Эти факторы представляют собой непосредственно не измеряемые, скрытые (латентные) переменные, в той или иной мере связанные с исходными наблюдаемыми переменными. Ковариационная матрица ∑ исходных признаков x_i, в соответствии с моделью факторного анализа (1), может быть представлена в виде

orlova03.wmf (2)

где L = (l_ij) – матрица нагрузок на общие факторы, i = 1, 2, …, p, j = 1, 2, …, m; V – диагональная матрица дисперсий специфических факторов e_i. Диагональные элементы матрицы orlova04.wmf представляют собой дисперсии признаков, объясняемые m общими факторами. Эти элементы называются общностями, а сама матрица ∑⁺ – редуцированной корреляционной матрицей.

Выбор метода оценки матрицы нагрузок на общие факторы

Оценки матрицы нагрузок L обычно получают одним из двух способов: методом главных осей или методом максимального правдоподобия [1, 2, 4]. В методе главных осей в качестве оценок матрицы нагрузок выбирают первые m собственных векторов редуцированной корреляционной матрицы ∑⁺, соответствующие наибольшим собственным значениям матрицы ∑⁺. В методе максимального правдоподобия оценка матрицы нагрузок получается путём максимизации функции правдоподобия, считая, что вектор наблюдаемых признаков orlova05.wmf имеет многомерное нормальное распределение. Хотя оба метода направлены на максимальное приближение внедиагональных элементов корреляционной матрицы, тем не менее методы дают несколько различные результаты. При этом, как показали результаты численного моделирования, метод максимального правдоподобия приближает корреляционную матрицу немного лучше метода главных осей, даже если вектор наблюдаемых переменных orlova06.wmf не имеет многомерное нормальное распределение. При этом метод максимального правдоподобия имеет под собой строгое математическое обоснование и оценки максимального правдоподобия обладают рядом хороших свойств, как-то: состоятельность, асимптотическая эффективность и асимптотическая несмещённость. Поэтому выбор метода максимального правдоподобия является предпочтительным. Однако метод максимального правдоподобия для оценки матрицы нагрузок не может применяться в некоторых ситуациях, например когда дисперсии специфических факторов равны нулю. В этой ситуации нами предлагается добавить в процесс оценивания преобразование исходных данных, с тем чтобы к преобразованным данным можно было применить метод максимального правдоподобия. Рассмотрим подробнее метод решения задач факторного анализа в этих ситуациях.

При практическом использовании факторного анализа часто возникают следующие ситуации:

1) некоторые специфические факторы отсутствуют в факторной модели;

2) выборочная ковариационная матрица исходных переменных не является положительно определенной.

Пусть orlova07.wmf – выборка из р-мерной нормальной совокупности N (0, ∑).

Допустим, что вектор orlova08.wmf генеральной совокупности удовлетворяет модели факторного анализа (1)

orlova09.wmf (3)

где orlova10.wmf – вектор наблюдаемых переменных, orlova11.wmf orlova12.wmf – векторы общих и специфических факторов соответственно, не наблюдаемые непосредственно; L = (l_jk) – матрица нагрузок orlova13.wmf на общие факторы.

В модели (3) предполагается, что (m + p)-мерный вектор факторов orlova14.wmf имеет нулевое математическое ожидание и ковариационная матрица orlova15.wmf имеет вид

orlova16.wmf

где orlova17.wmf – единичная матрица; orlova18.wmf – диагональная матрица.

Из модели (3) вытекает, что ковариационная матрица вектора orlova19.wmf равна

orlova20.wmf (4)

В приложениях факторного анализа возникают следующие задачи [1]:

1. Получение оценок матриц L и V.

2. Оценка числа общих факторов m.

3. Решение первых двух задач в условиях сильной коррелированности переменных, когда некоторые из них являются линейными комбинациями остальных.

Обозначим через S выборочную ковариационную матрицу вектора orlova21.wmf .

Допустим, что ковариационная матрица ∑ не вырождена. Тогда матрица S имеет распределение Уишарта, и оценка максимального правдоподобия матриц L и V получается из условия максимизации функции Z₀ [4, 5]:

orlova22.wmf (5)

В литературе описаны два основных подхода к решению задачи максимизации функции Z₀ [2, 3, 4]. В обоих известных методах, основанных на них, предполагается, что все оценки дисперсий специфических факторов orlova23.wmf отличны от нуля. Однако в практических исследованиях встречаются такие матрицы S, для которых некоторые оценки orlova24.wmf близки к нулю. Это может явиться следствием одной из следующих причин:

a) в модели (3) некоторые дисперсии специфических факторов vj равны нулю, т.е. размерность вектора факторов orlova25.wmf меньше m + р. В данной ситуации при любом объеме выборки некоторые оценки orlova26.wmf могут быть близки к нулю;

б) в модели (3) некоторые v_jблизки к нулю; в этом случае, если объем выборки был бы достаточно велик, все оценки дисперсий orlova27.wmf были бы больше нуля.

В практических расчетах матрица S иногда не является положительно определенной. Это может быть вызвано тем, что

а) в модели факторного анализа (3) больше, чем m, специфических факторов имеют нулевую дисперсию ( orlova28.wmf имеет вырожденное распределение);

б) определитель |∑| близок к нулю, и вследствие недостаточно большого объема выборки или ошибок округления матрица S может оказаться не положительно определённой.

Если S не является положительно определенной, то плотность распределения Уишарта равна нулю и мы не можем воспользоваться для оценки матриц нагрузок L и V функцией максимального правдоподобия [4].

Поскольку проверка гипотез о числе общих факторов производится после того, как определены оценки orlova29.wmf и orlova30.wmf [4], то в рассматриваемых ситуациях мы не сможем проверить эти гипотезы. Если максимум функции правдоподобия (5) ищется методом Лоули [4], то число общих факторов m и начальные приближения оценок orlova31.wmf и orlova32.wmf часто находят центроидным методом. Следует отметить, что в рассматриваемых ситуациях мы не сможем оценить число общих факторов также и в центроидном методе.

Итак, в ряде случаев нельзя использовать разработанный аппарат оценок максимального правдоподобия матриц orlova33.wmf и orlova34.wmf и, соответственно, проверить гипотезы о числе общих факторов.

Для решения этих задач можно предложить искусственно увеличивать дисперсии специфических факторов.

Получение оценок матриц L и V

Пусть orlova35.wmf – случайная величина с диагональной ковариационной матрицей, не зависящая от orlova36.wmf . Обозначим через orlova37.wmf выборочную ковариационную матрицу случайного вектора orlova38.wmf и через orlova39.wmf – матрицу выборочных коэффициентов ковариации векторов orlova40.wmf и orlova41.wmf ,

orlova42.wmf

где orlova43.wmf , orlova44.wmf – векторы значений orlova45.wmf и orlova46.wmf в i-м наблюдении, n + 1 – объем выборки.

Для того, чтобы дисперсии всех специфических факторов сделать отличными от нуля, прибавим к обеим частям модели (2) вектор orlova47.wmf . Тогда модель (2) примет вид

orlova48.wmf (6)

где orlova49.wmf orlova50.wmf

Матрицы нагрузок на общие факторы L в моделях (3) и (6) совпадают.

Вектор orlova51.wmf имеет многомерное нормальное распределение N(0, Σ₀), где Σ₀ = Σ + Δ.

Выберем диагональную матрицу Δ таким образом, чтобы S₀ – выборочная ковариационная матрица вектора orlova52.wmf стала положительно определенной и оценки дисперсий всех специфических факторов модели (6) стали отличными от нуля.

Выборочная ковариационная матрица S₀вектора orlova53.wmf будет иметь распределение Уишарта w(Σ₀, n). Так как S₀ положительно определена, плотность распределения Уишарта в точке S₀ отлична от нуля [4]. Следовательно, для оценки матриц L и V₀ модели (6) применим метод максимального правдоподобия. Функцию максимального правдоподобия получим, заменив в (5) orlova54.wmf на orlova55.wmf , S на S₀ и orlova56.wmf на orlova57.wmf . В силу выбора Δ оценки дисперсий специфических факторов положительны. Поэтому для максимизации функции правдоподобия можно воспользоваться любым из двух описанных в литературе подходов. При этом мы получим состоятельные, асимптотически несмещенные и эффективные оценки матриц L и V₀. Оценка матрицы нагрузок V на специфические факторы в модели (3) определяется из соотношения

orlova58.wmf .

В практических задачах часто приходится рассматривать в качестве исходной выборочную корреляционную, а не ковариационную матрицу переменных. В этом случае полученную оценку матрицы нагрузок на общие факторы вектора orlova59.wmf необходимо преобразовать, чтобы получить оценку матрицы нагрузок на вектор orlova60.wmf .

Пусть orlova61.wmf – оценка матрицы нагрузок на общие факторы нормированного вектора orlova62.wmf , orlova63.wmf и orlova64.wmf – оценки корреляционных матриц нормированных векторов orlova65.wmf и orlova66.wmf соответственно.

Очевидно,

orlova67.wmf (7)

где orlova68.wmf

Из (7) получаем

orlova69.wmf

Считая orlova70.wmf не зависящей от выборки, легко показать, что

orlova71.wmf

где orlova72.wmf – оценка матрицы L модели (6).

Оценка orlova73.wmf вычисляется по формуле

orlova74.wmf

Оценка числа общих факторов

Для проверки гипотез о числе общих факторов используется статистика [4]

orlova75.wmf

Так как матрицы S₀ и orlova76.wmf не вырождены, то можно теперь для модели (6) проверить гипотезы о числе общих факторов.

Числа общих факторов в моделях (6) и (3) равны между собой.

Очевидно, при фиксированной матрице Δ, P_m → 1 по вероятности при n → ∞, где Р_m – вероятность принять гипотезу H₀ о числе общих факторов в модели (6), равном m.

Рассмотрим зависимость статистики Z₁ от выбора матрицы Δ при фиксированном объеме выборки.

Выборочная ковариационная матрица вектора orlova77.wmf равна

orlova78.wmf (8)

Оценка максимального правдоподобия матрицы V₀ связана с S₀ и orlova79.wmf соотношением [4]

orlova80.wmf (9)

Учитывая (8) и (9), нетрудно получить, что при orlova81.wmf .

orlova82.wmf orlova83.wmf (10)

orlova84.wmf (11)

по вероятности.

При Δ_jj → ∞ оценки orlova85.wmf по вероятности, откуда, с учетом соотношений (10) и (11), получаем, что статистика Z₁ при orlova86.wmf стремится к нулю по вероятности. Следовательно, в этом случае P₀ → 1 по вероятности, где P₀ – вероятность принять гипотезу H₀ о том, что число общих факторов равно нулю.

Поскольку статистика Z₁ с ростом дисперсии «шума» убывает, при решении практических задач оценка числа общих факторов вследствие недостаточного объема выборки может оказаться заниженной. Поэтому численные значения Δ_jjследует выбирать не слишком большими, лишь бы только новые оценки дисперсий специфических факторов в модели (6) не получились равными нулю. Поскольку дисперсии оценок зависят от объема выборки, то и выбор численных значений Δ_jj будет зависеть в этом случае от объема выборки.

Факторный анализ направлен на анализ структуры внедиагональных элементов ковариационных матриц. Чем меньшие значения Δ_jj будут выбраны, тем меньше будут отличаться внедиагональные элементы выборочных ковариационных матриц S и S₀ и, следовательно, тем меньшее влияние на оценку матрицы нагрузок L окажет наложенный на статистические данные «шум» (при фиксированном объеме выборки). Это также является аргументом в пользу выбора небольших значений Δ_jj.

Случай вырожденного распределения

В практических исследованиях может встретиться ситуация, когда какая-то компонента вектора orlova88.wmf , например х₁, является линейной комбинацией остальных. Рассмотрим, как и выше, вектор orlova89.wmf и допустим, что Δ₁₁ > 0 (Δ₁₁ – дисперсия u₁). Тогда, если независимые переменные х₂, х₃,…, х_p имеют невырожденное многомерное нормальное распределение, то и вектор orlova90.wmf будет иметь невырожденное нормальное распределение и можно, таким образом, включить х₁в факторную модель (6). Это дает большую свободу в отборе переменных для факторного анализа, а также может быть использовано при построении уравнения регрессии с помощью факторного анализа.

Рецензенты:

Кобелев Н.Б., д.э.н., профессор кафедры «Системный анализ и моделирование экономических процессов», Финансовый университет при Правительстве РФ, Президент НП «Ремесленная палата России», г. Москва;

Киселёва И.А., д.э.н., профессор кафедры «Прикладная математика», МЭСИ, г. Москва.

Scientific journal
Fundamental research

ISSN 1812-7339

"Перечень" ВАК

ИФ РИНЦ = 1,984

THE CHOICE OF ASSESSMENT METHOD OF THE MATRIX OF LOADINGS IN FACTOR ANALYSIS AND ALGORITHM EVALUATION IN THE ABSENCE OF SOME SPECIFIC FACTORS

Fundamental research
Scientific journal | ISSN 1812-7339 | Certificate - PI №77-15598