Факторный анализ позволяет установить. Факторный анализ. Интегральный метод факторного анализа
Возникновение и развитие факторного анализа тесно связано с измерениями в психологии. Длительное время факторный анализ и воспринимался как математическая модель в психологической теории интеллекта. Лишь начиная с 50-х годов ХХ столетия, одновременно с разработкой математического обоснования факторного анализа, этот метод становится общенаучным. К настоящему времени факторный анализ является неотъемлемой частью любой серьезной статистической компьютерной программы и входит в основной инструментарий всех наук, имеющих дело с многопараметрическим описанием изучаемых объектов, таких, как социология, экономика, биология, медицина и другие.
Основная идея факторного анализа была сформулирована еще Ф. Гальтоном , основоположником измерений индивидуальных различий. Она сводится к тому, что если несколько признаков, измеренных на группе индивидов, изменяются согласованно, то можно предположить существование одной общей причины этой совместной изменчивости - фактора как скрытой (латентной), непосредственно не доступной измерению переменной.
Таким образом, главная цель факторного анализа - уменьшение размерности исходных данных с целью их экономного описания при условии минимальных потерь исходной информации. Результатом факторного анализа является переход от множества исходных переменных к существенно меньшему числу новых переменных - факторов. Фактор при этом интерпретируется как причина совместной изменчивости нескольких исходных переменных.
Если исходить из предположения о том, что корреляции могут быть объяснены влиянием скрытых причин - факторов, то основное назначение факторного анализа - анализ корреляций множества признаков.
Одна из основных задач факторного анализа – интерпретация факторов. Ее решение заключается в идентификации факторов через исходные переменные. Осуществляется по результатам обработки с помощью факторных нагрузок. Факторные нагрузки – аналоги коэффициентов корреляции, показывают степень взаимосвязи соответствующих переменных и факторов. Чем больше абсолютная величина факторной нагрузки, тем сильнее связь переменной с фактором, тем больше данная переменная обусловлена действием соответствующего фактора. Каждый фактор идентифицируется по тем переменным, с которыми он в наибольшей степени связан, то есть по переменным, имеющим по этому фактору наибольшие нагрузки. Идентификация фактора заключается, как правило, в присвоении ему имени, обобщающего по смыслу наименования входящих в него переменных.
Если исследователя интересует только структура измеренных признаков, на этом факторный анализ завершается. Продолжая факторный анализ, исследователь далее может вычислить значения факторов для испытуемых, например, с целью их дифференциации по преобладанию арифметических или вербальных способностей.
Выбирая факторный анализ как средство изучения корреляций, исследователь должен отдавать себе отчет в том, что это один из самых сложных и трудоемких методов. Зачастую нет веских оснований предполагать наличие факторов как скрытых причин изучаемых корреляции, и задача заключается лишь в обнаружении группировок тесно связанных переменныx. Тогда целесообразнее вместо факторного анализа использовать кластерный анализ корреляций . Помимо простоты, кластерный анализ обладает еще одним преимуществом: его применение не связано с потерей исходной информации о связях между переменными, что неизбежно при факторном анализе. И уже после выделения групп тесно связанных переменных можно попытаться применить факторный анализ для их объяснения.
Итак, можно сформулировать основные задачи факторного анализа:
1. Исследование структуры взаимосвязей переменных. В этом случае каждая группировка переменных будет определяться фактором, по которому эти переменные имеют максимальные нагрузки.
2. Идентификация факторов как скрытых (латентных) переменных - причин взаимосвязи исходных переменных.
3. Вычисление значений факторов для испытуемых как новых, интегральных переменных. При этом число факторов существенно меньше числа исходных переменных. В этом смысле факторный анализ решает задачу сокращения количества признаков с минимальными потерями исходной информации.
МАТЕМАТИКО-СТАТИСТИЧЕСКИЕ ИДЕИ И ПРОБЛЕМЫ МЕТОДА
Модель главных компонент лежит в основе большинства методов факторного анализа и часто рассматривается как один из его самостоятельных вариантов. Анализ главных компонент преобразует набор коррелирующих исходных переменных в другой набор - некоррелирующих переменных. Проще всего понять суть этого метода, привлекая геометрические представления.
Предположим, у нас имеются две положительно коррелирующие переменные Х и У, измеренные на группе объектов. Тогда график двумерного распределения (рассеивания) этих объектов в осях измеренных признаков (координаты объектов заданы значениями признаков) будет представлять собой эллипс (рис. 1). Главная ось эллипса М 1 , - это прямая, вдоль которой будет наблюдаться наибольший разброс данных. Вдоль второй оси эллипса М 2 , перпендикулярной первой и проходящей через ее середину, будет наблюдаться наименьший разброс данных.
Рисунок 1. Рисунок 2.
Если перед нами стоит задача представления объектов (точек) в терминах только одной размерности (переменной), то главная ось эллипса является наиболее подходящей, так как вдоль нее объекты отличаются друг от друга лучше (дисперсия больше), чем вдоль любой другой прямой, в том числе и вдоль отдельно оси Х или У.
Анализ главных компонент можно представить как преобразование информации, содержащейся в исходных данных. Главную компоненту можно определить как направление, в котором наблюдается наибольший разброс объектов. Представляя объекты в единицах измерения по этой оси, мы теряем минимум информации об отличии объектов друг от друга. Чем сильнее взаимосвязь двух переменных, тем меньше исходной информации теряется при переходе от двух переменных к одной главной компоненте. Если две переменные не коррелируют, то компоненты (оси) являются равнозначными по информативности, и невозможно определить одну из них как «главную» (рис. 2).
При наличии трех и более коррелирующих переменных принцип определения главных компонент тот же, только модель будет не на плоскости, а в - мерном пространстве, и будет представлять собой - мерный эллипсоид.
Проблемы факторного анализа.
1. Проблема числа факторов. Это первая проблема при проведении факторного анализа. Обычно заранее неизвестно, сколько факторов необходимо и достаточно для представления данного набора переменных. Сама же процедура факторного анализа предполагает предварительное задание числа факторов. Следовательно, исследователь должен заранее определить или оценить их возможное количество. Для этого на первом этапе факторного анализа применяется анализ главных компонент и используется график собственных значений. Для определения числа факторов используется два критерия – критерий Кайзера и критерий отсеивания Кеттела. Эти критерии являются лишь примерным ориентиром, окончательное решение о числе факторов применяется после интерпретации факторов.
2. Проблема общности. Это вторая главная проблема факторного анализа. Общность – это часть дисперсии переменной, обусловленная действием общих факторов. Характерность – часть дисперсии, обусловленная спецификой данной переменной и ошибками измерений. Иными словами, общность – это вклад всех факторов в единичную дисперсию переменной. Проблема общностей заключается в том, что они как и число факторов, неизвестны до начала анализа, но должны каким-то образом задаваться заранее, так как величины факторных нагрузок зависят от величин общностей. В зависимости от решения этой проблемы различают разные методы факторного анализа , то есть, разные способы получения факторной структуры при заданном числе факторов. Наиболее часто применимые методы – анализ главных компонент, факторный анализ образов, метод главных осей, метод невзвешенных наименьших квадратов, обобщенный метод наименьших квадратов и метод максимального правдоподобия.
3. Проблема вращения и интерпретации . Это третья основная проблема факторного анализа, решение которой связано с геометрическим представлением факторной структуры. Факторная структура может быть представлена в виде точек-признаков в пространстве факторов. Координаты точки – это факторные нагрузки. Осуществляют поворот осей, чтобы каждая переменная в результате вращения оказалась вблизи оси фактора (варимакс-вращение). В результате вращения каждая переменная имеет нагрузку только по одному фактору. По составу переменных производят интерпретацию факторов.
4. Проблема оценки значений факторов . После интерпретации факторной структуры допустима оценка значений факторов для объектов. Это позволяет перейти к существенно меньшему числу факторов как новых переменных. Это может понадобиться исследователю как для более компактного представления различий между объектами, так и для дальнейшего анализа – регрессионного, дисперсионного и т.д. Для оценки значения фактора используется линейная комбинация значений исходных переменных. Проблема состоит в том, что невозможно точно выразить общий фактор через исходные переменные, можно получить лишь оценку с различной надежностью, так как каждая из переменных содержит кроме общей характерную часть. Факторизация оценки будет тем надежнее, чем больше исходные переменные соответствуют требованиям, предъявляемым к метрическим переменным.
В заключение обзора математических идей и проблем метода следует отметить, что факторный анализ – сложная, но изящная математическая процедура, имеющая достаточное статистическое обоснование. Факторный анализ не добавляет новой информации к эмпирическим данным, только позволяет их интерпретировать.
ПОСЛЕДОВАТЕЛЬНОСТЬ ФАКТОРНОГО АНАЛИЗА
Особенность факторного анализа заключается в неопределенности решения его основных проблем. Нет четких критериев качества, есть лишь рекомендации, которыми руководствуется исследователь. Поэтому факторный анализ – пошаговая процедура, где на каждом шаге принимается решение о дальнейших преобразованиях данных.
Весь процесс факторного анализа можно представить как выполнение шести этапов:
1. Выбор исходных данных. Основное требование – все признаки должны быть измерены в метрической шкале. Недопустима функциональная зависимость и корреляции, близкие к единице (для устранения этих переменных вычисляют матрицу интеркорреляций).
2. Решение проблемы числа факторов. Матрица интеркорреляций обрабатывается с использованием анализа главных компонент, применяются критерии отсеивания.
3. Факторизация матрицы интеркорреляций одним из методов.
4. Вращение факторов и их предварительная интерпретация.
5. Принятие решения о качестве факторной структуры.
6. Вычисление факторных коэффициентов и оценок.
До широкого распространения персональных компьютеров полновесный факторный анализ был экзотической, весьма трудоемкой многоэтапной процедурой, когда очередной шаг исследователь выбирает по результатам выполнения предыдущих этапов. В настоящее время можно контролировать процесс факторного анализа, пользуясь современным программным обеспечением. Для этого не нужны знания программиста и математика, достаточны осведомленность в основных математико-статистических идеях метода и умение «читать» промежуточные и конечные результаты факторного анализа. При этом факторный анализ может быть рекомендован для решения очень широкого круга не только исследовательских, но и практических задач. Перечислим некоторые из них:
· факторный анализ как инструмент интерпретации позволяет быстро выделить группировки (кластеры) взаимосвязанных переменных, решая проблемы корреляционного анализа: наличия множества переменных и множества статистических проверок.
· факторный анализ как альтернатива простого суммирования значений исходных переменных позволяет учитывать реальную структуру данных и избегать излишних потерь драгоценной исходной информации. Затраты времени и сил па такую обработку данных при помощи факторного анализа часто меньше, чем при суммировании баллов «вручную». При этом выигрыш весьма ощутим - в детальности и корректности получаемых результатов.
· факторный анализ как подготовительный этап для прогнозирования позволяет получить некоррелированные интегральные переменные (факторы), наиболее пригодные для применения в регрессионном или дискриминантном анализе.
· факторный анализ при исследовании индивидуальных или межгрупповых различий по множеству признаков позволяет сократить исходное множество признаков до нескольких факторов, по которым различия проявляются наиболее ярко.
Основные положения
Факторный анализ – это один из новых разделов многомерного статистического анализа. Первоначально этот метод разрабатывался для объяснения корреляции между исходными параметрами. Результатом корреляционного анализа является матрица коэффициентов корреляции. При малом числе признаков (переменных) можно провести визуальный анализ этой матрицы. С ростом числа признаков (10 и более) визуальный анализ не даст положительных результатов. Оказывается, что все многообразие корреляционных связей можно объяснить действием нескольких обобщенных факторов, которые являются функциями исследуемых параметров, при этом сами факторы могут быть неизвестны, но их можно выразить через исследуемые признаки. Основоположником факторного анализа является американский ученый Л.Терстоун.
Современные статистики под факторным анализом понимают совокупность методов, которые на основе реально существующей связи между признаками позволяет выявить латентные (скрытые) обобщающие характеристики организационной структуры и механизмы развития изучаемых явлений и процессов.
Пример: предположим, что n автомобилей оценивается по 2 признакам:
x 1 – стоимость автомобиля,
x 2 – длительность рабочего ресурса мотора.
При условии коррелированности x 1 и x 2 в системе координат появляется направленное и достаточно плотное скопление точек, формально отображаемое новыми осями и(Рис.5).
Рис.6

Характерная особенность F 1 и F 2 заключается в том, что они проходят через плотные скопления точек и в свою очередь коррелируют с x 1 x 2 .Максимальное
число новых осей будет равно числу элементарных признаков. Дальнейшие разработки факторного анализа показали, что этот метод может быть с успехом применены в задачах группировки и классификации объектов.
Представление информации в факторном анализе.
Для проведения факторного анализа информация должна быть представлена в виде матрицы размером m x n:
Строки матрицы соответствуют объектам наблюдений (i=), а столбцы – признакам (j=).
Признаки, характеризующие объект имеют разную размерность. Для того, чтобы их привести к одной размерности и обеспечить сопоставимость признаков матрицу исходных данных обычно нормируют, вводя единый масштаб. Самым распространенным способом нормировки является стандартизация. От переменных переходят к переменным
Среднее значение j признака,
Среднеквадратическое отклонение.
Такое преобразование называется стандартизацией.
Основная модель факторного анализа
Основная модель факторного анализа имеет вид:
z j – j -й признак (величина случайная);
F 1 , F 2 , …, F p – общие факторы (величины случайные, нормально распределенные);
u j – характерный фактор;
j1 , j2 , …, jp – факторы нагрузки, характеризующие существенность влияния каждого фактора (параметры модели, подлежащие определению);
Общие факторы имеют существенное значение для анализа всех признаков. Характерные факторы показывают, что он относится только к данному -му признаку, это специфика признака, которая не может быть выражена через факторы. Факторные нагрузки j1 , j2 , …, jp характеризуют величину влияния того или иного общего фактора в вариации данного признака. Основная задача факторного анализа – определить факторные нагрузки. Дисперсию S j 2 каждого признака, можно разделить на 2 составляющие:
первая часть обуславливает действие общих факторов – общность h j 2 ;
вторая часть обуславливает действие характерного фактора –характерность - d j 2 .
Все переменные представлены в стандартизованном виде, поэтому дисперсия - гопризнака S j 2 = 1.
Если общие и характерные факторы не коррелируют между собой, то дисперсию j-го признака можно представить в виде:
где - доля дисперсии признака, приходящаяся на k -ый фактор.
Полный вклад какого-либо фактора в суммарную дисперсию равен:
Вклад всех общих факторов в суммарную дисперсию:
Результаты факторного анализа удобно представить в виде таблицы.
|
Факторные нагрузки |
Общности |
|
|
a 11 a 21 … a p1 a 12 a 22 … a p2 … … … … a 1m a 2m … a pm | ||
|
факторов |
V 1 V 2 … V p |
А - матрица факторных нагрузок. Ее можно получить различными способами, в настоящее время наиболее распространение получил метод главных компонент или главных факторов.
Вычислительная процедура метода главных факторов.
Решение задачи с помощью главных компонент сводится к поэтапному преобразованию матрицы исходных данных X :

Х - матрица исходных данных;
Z – матрица стандартизированных значений признаков,
R – матрица парных корреляций:
Диагональная матрица собственных (характеристических) чисел,
j находят решением характеристического уравнения
Е –единичная матрица,
j – показатель дисперсии каждой главной компоненты ,
при условии стандартизации исходных данных , тогда=m
U – матрица собственных векторов, которые находят из уравнения:
Реально это означает решение m систем линейных уравнений для каждого
Т.е. каждому собственному числу соответствует система уравнений.
Затем находят V - матрицу нормированных собственных векторов.
Матрицу факторного отображения А вычисляют по формуле:
Затем находим значения главных компонент по одной из эквивалентных формул:
Совокупность из четырех промышленных предприятий оценена по трем характерным признакам:
среднегодовая выработка на одного работника х 1 ;
уровень рентабельности х 2 ;
Уровень фондоотдачи х 3.
Результат представлен в стандартизированной матрице Z :

По матрице Z получена матрица парных корреляций R :
![]()
Найдем определитель матрицы парных корреляций(например методом Фаддеева):
Построим характеристическое уравнение:
Решая это уравнение найдем:
Таким образом исходные элементарные признаки х 1 , х 2 , х 3 могут быть обобщены значениями трех главных компонент, причем:
F 1 объясняет примерно всей вариации,
F 2 - , аF 3 -
Все три главные компоненты объясняют вариации полностью на 100%.
![]()
Решая эту систему находим:
Аналогично строятся системы для 2 и 3 . Для 2 решение системы:
Матрица собственных векторов U принимает вид:

Каждый элемент матрицы разделим на сумму квадратов элементов j-го
столбца, получим нормированную матрицу V .
![]()
Отметим, что должно выполнятся равенство =E .
Матрицу факторного отображения получим из матричного соотношения
=
По смыслу каждый элемент матрицы А представляет частные коэффициенты матрицы корреляции между исходным признаком x j и главными компонентами F r . Поэтому все элементы .
Из равенства следует условиеr - число компонент .
Полный вклад каждого фактора в суммарную дисперсию признаков равен:

Модель факторного анализа примет вид:
![]()
Найдем значения главных компонент (матрицу F ) по формуле

Центр распределения значений главных компонент находится в точке (0,0,0).
Далее аналитические выводы по результатам расчетов следуют уже после принятия решения о числе значащих признаков и главных компоненти определения названий главным компонентам. Задачи распознавания главных компонент, определения для них названий решают субъективно на основе весовых коэффициентовиз матрицы отображенияА .
Рассмотрим вопрос формулировки названий главных компонент.
Обозначим w 1 – множество незначимых весовых коэффициентов, в которое включаются близкие к нулю элементы,,
w 2 - множество значимых весовых коэффициентов,
w 3 – подмножество значимых весовых коэффициентов, не участвующих в формировании названия главной компоненты.
w 2 - w 3 – подмножество весовых коэффициентов, участвующих в формировании названия.
Вычисляем коэффициент информативности для каждого главного фактора
Набор объяснимых признаков считаем удовлетворительным, если значения коэффициентов информативности лежат в пределах 0,75-0,95.
a 11 =0,776 a 12 =-0,130 a 13 =0,308
a 12 =0,904 a 22 =-0,210 a 23 =-0,420
а 31 =0,616 а 32 =0,902 а 33 =0,236
Для j=1 w 1 = ,w 2 ={a 11 ,a 21 ,a 31 },
.
Для j=2 w 1 ={ a 12 , a 22 }, w 2 ={ а 32 },
Для j=3 w 1 ={ а 33 }, w 2 ={a 13 ,a 33 },
Значениями признаков x 1 , x 2 , x 3 определяется состав главной компоненты на 100%. при этом наибольший вклад признакаx 2 , смысл которого-рентабельность. корректным для названия признака F 1 будет эффективность производства .
F 2 определяется компонентой x 3 (фондоотдача), назовем ее эффективность использования основных производственных средств .
F 3 определяется компонентами x 1 ,x 2 –в анализе может не рассматриваться т.к. она объясняет всего 10% общей вариации.
Литература.
Попов А.А.
Excel: Практическое руководство, ДЕСС КОМ.-М.-2000.
Дьяконов В.П., Абраменкова И.В. Mathcad7 в математике, физике и в Internet. Изд-во « Номидж», М.-1998, раздел 2.13. Выполнение регрессии.
Л.А. Сошникова, В.Н. Томашевич и др. Многомерный статистический анализ в экономике под ред. В.Н. Томашевича.- М. –Наука, 1980.
Колемаев В.А., О.В. Староверов, В.Б. Турундаевский Теория вероятностей и математическая статистика. –М. – Высшая школа- 1991.
К Иберла. Факторный анализ.-М. Статистика.-1980.
|
Сравнение двух средних нормальных генеральных совокупностей, дисперсии которых известны |
|
Пусть генеральные совокупности X и Y распределены нормально, причем их дисперсии известны (например из предшествующего опыта или найдены теоретически). По независимым выборкам объемов n и m, извлеченным из этих совокупностей, найдены выборочные средние x в и y в. Требуется по выборочным средним при заданном уровне значимости проверить нулевую гипотезу, состоящую в том, что генеральные средние (математические ожидания) рассматриваемых совокупностей равны между собой, т. е. Н 0: М(X) = М(Y). Учитывая, что выборочные средние являются несмещенными оценками генеральных средних, т. е. М(x в) = М(X) и М(y в) = М(Y), нулевую гипотезу можно записать так: Н 0: М(x в) = М(y в). Таким образом, требуется проверить, что математические ожидания выборочных средних равны между собой. Такая задача ставится, потому что, как правило, выборочные средние являются различными. Возникает вопрос: значимо или незначимо различаются выборочные средние? Если окажется, что нулевая гипотеза справедлива, т. е. генеральные средние одинаковы, то различие выборочных средних незначимо и объясняется случайными причинами и, в частности, случайным отбором объектов выборки. Если нулевая гипотеза будет отвергнута, т. е. генеральные средние неодинаковы, то различие выборочных средних значимо и не может быть объяснено случайными причинами. А объясняется тем, что сами генеральные средние (математические ожидания) различны. В качестве проверки нулевой гипотезы примем случайную величину. Критерий Z – нормированная нормальная случайная величина. Действительно, величина Z распределена нормально, так как является линейной комбинацией нормально распределенных величин X и Y; сами эти величины распределены нормально как выборочные средние, найденные по выборкам, извлеченным из генеральных совокупностей; Z – нормированная величина, потому что М(Z) = 0, при справедливости нулевой гипотезы D(Z) = 1, поскольку выборки независимы. Критическая область строится в зависимости от вида конкурирующей гипотезы. Первый случай . Нулевая гипотеза Н 0:М(X)=М(Y). Конкурирующая гипотеза Н 1: М(X) ¹М(Y). В этом случае строят двустороннюю критическую область исходя из требования, чтобы вероятность попадания критерия в эту область, в предположении справедливости нулевой гипотезы, была равна принятому уровню значимости . Наибольшая мощность критерия (вероятность попадания критерия в критическую область при справедливости конкурирующей гипотезы) достигается тогда, когда «левая» и «правая» критические точки выбраны так, что вероятность попадания критерия в каждый интервал критической области равна: P(Z < zлев.кр)=a¤2, P(Z > zправ.кр)=a¤2. (1) Поскольку Z – нормированная нормальная величина, а распределение такой величины симметрично относительно нуля, критические точки симметричны относительно нуля. Таким образом, если обозначить правую границу двусторонней критической области через zкр, то левая граница -zкр. Итак, достаточно найти правую границу, чтобы найти саму двустороннюю критическую область Z < -zкр, Z > zкр и область принятия нулевой гипотезы (-zкр, zкр). Покажем, как найти zкр – правую границу двусторонней критической области, используя функцию Лапласа Ф(Z). Известно, что функция Лапласа определяет вероятность попадания нормированной нормальной случайной величины, например Z, в интервале (0;z): Р(0
< Z Так
как распределение Z симметрично
относительно нуля, то вероятность
попадания Z в интервал (0; ¥) равна 1/2.
Следовательно, если разбить этот
интервал точкой zкр на интервал (0, zкр)
и (zкр, ¥), то по теореме сложения Р(0<
Z < zкр)+Р(Z > zкр)=1/2. В
силу (1) и (2) получим Ф(zкр)+a/2=1/2.
Следовательно,
Ф(zкр) =(1-a)/2. Отсюда
заключаем: для того чтобы найти правую
границу двусторонней критической
области (zкр), достаточно найти значение
аргумента функции Лапласа, которому
соответствует значение функции, равное
(1-a)/2. Тогда
двусторонняя критическая область
определяется неравенствами Z < –
zкр, Z > zкр, или равносильным неравенством
½Z½ > zкр, а область принятия нулевой
гипотезы неравенством – zкр < Z <
zкр или равносильным неравенством çZ
ç< zкр. Обозначим
значение критерия, вычисленное по
данным наблюдений, через zнабл и
сформулируем правило проверки нулевой
гипотезы. Правило.
1.
Вычислить наблюдаемое значение
критерия 2.
По таблице функции Лапласа найти
критическую точку по равенству
Ф(zкр)=(1-a)/2. 3.
Если ç zнабл ç < zкр – нет оснований
отвергнуть нулевую гипотезу. Если
ç zнабл ç> zкр – нулевую гипотезу
отвергают. Второй
случай
.
Нулевая гипотеза Н0: M(X)=M(Y). Конкурирующая
гипотеза Н1: M(X)>M(Y). На
практике такой случай имеет место,
если профессиональные соображения
позволяют предположить, что генеральная
средняя одной совокупности больше
генеральной средней другой. Например,
если введено усовершенствование
технологического процесса, то
естественно допустить, что оно приведет
к увеличению выпуска продукции. В
этом случае строят правостороннюю
критическую область исходя из
требования, чтобы вероятность попадания
критерия в эту область, в предположении
справедливости нулевой гипотезы, была
равна принятому уровню значимости: P(Z>
zкр)=a.
(3) Покажем,
как найти критическую точку при помощи
функции Лапласа. Воспользуемся
соотношением P(0 В
силу (2) и (3) имеем Ф(zкр)+a=1/2.
Следовательно,
Ф(zкр)=(1-2a)/2. Отсюда
заключаем, для того чтобы найти границу
правосторонней критической области
(zкр), достаточно найти значение функции
Лапласа, равное (1-2a)/2. Тогда правосторонняя
критическая область определяется
неравенством Z > zкр, а область принятия
нулевой гипотезы – неравенством Z <
zкр. Правило.
1.
Вычислить наблюдаемое значение
критерия zнабл. 2.
По таблице функции Лапласа найти
критическую точку из равенства
Ф(zкр)=(1-2a)/2. 3.
Если Z набл <
z кр –
нет оснований отвергнуть нулевую
гипотезу. Если Z набл >
z кр –
нулевую гипотезу отвергаем. Третий
случай.
Нулевая
гипотеза Н0: M(X)=M(Y). Конкурирующая
гипотеза Н1: M(X) В
этом случае строят левостороннюю
критическую область исходя из
требования, вероятность попадания
критерия в эту область, в пред- положении
справедливости нулевой гипотезы, была
равна принятому уровню значимости
P(Z < z’кр)=a, т.е. z’кр= – zкр. Таким
образом, для того чтобы найти точку
z’кр, достаточно сначала найти
“вспомогательную точку” zкр а затем
взять найденное значение со знаком
минус. Тогда левосторонняя критическая
область определяется неравенством Z
< -zкр, а область принятия нулевой
гипотезы – неравенством Z > -zкр. Правило.
1.
Вычислить Zнабл. 2.
По таблице функции Лапласа найти
“вспомогательную точку” zкр по
равенству Ф(zкр)=(1-2a)/2, а затем положить
z’кр = -zкр. 3.
Если Zнабл > -zкр, – нет оснований
отвергать нулевую гипотезу. Если
Zнабл < -zкр, – нулевую гипотезу
отвергают. |
Их классификация
В современной статистике под факторным анализом понимают совокупность методов, которые на основе реально существующих связей признаков, объектов или явлений позволяют выявлять латентные
(скрытые и не доступные для непосредственного измерения) обобщающие характеристики организованной структуры и механизма развития изучаемых явлений или процессов.
Понятие латентности является ключевым и означает неявность характеристик, раскрываемых при помощи методов факторного анализа.
Идея, заложенная в основе факторного анализа, достаточно проста. В результате измерения мы имеем дело с набором элементарных признаков Х i , измеренных по нескольким шкалам. Это – явные переменные. Если признаки изменяются согласованно, то можно предположить существование определенных общих причин этой изменчивости, т.е. существование некоторых скрытых (латентных) факторов. Задача анализа – найти эти факторы.
Так как факторы представляют собой объединение определенных переменных, то из этого следует, что эти переменные связаны друг с другом, т.е. обладают корреляцией (ковариацией), причем большей между собой, чем с другими переменными, входящими в другой фактор. Методы отыскания факторов и основываются на использовании коэффициентов корреляции (ковариации) между переменными. Факторный анализ дает нетривиальное решение, т.е. решение нельзя предвидеть, не применяя специальную технику извлечения факторов. Это решение имеет большое значение для характеристики явления, так как вначале оно характеризовалось достаточно большим числом переменных, а в результате применения анализа оказалось, что его можно охарактеризовать меньшим числом других переменных – факторов.
Коррелировать могут не только явные переменные Х i , но и наблюдаемые объекты N i . В зависимости от того, какой тип корреляционной связи рассматривается – между признаками или объектами – различают соответственно R и Q техники обработки данных.
В соответствии с общими принципами факторного анализа, результат каждого измерения определяется действием общих факторов, специфических факторов и «фактором» ошибки измерения. Общими называются факторы, влияющие на результаты измерений по нескольким измерительным шкалам. Каждый из специфических факторов оказывает влияние на результат измерения только по одной из шкал. Под ошибкой измерения подразумевается совокупность не поддающихся учету причин, определяющих результаты измерения. Изменчивость полученных эмпирических данных обычно описывают с помощью их дисперсии.
Вам уже хорошо известно, что для количественного описания связи между двумя переменными чаще всего используется коэффициент корреляции. Существует много разновидностей этого коэффициента, причем выбор адекватной меры связи определяется как спецификой эмпирических данных, так и измерительной шкалой.
Однако существует еще и геометрическая возможность описания связи между признаками. Графически коэффициент корреляции между двумя переменными можно изобразить в виде двух векторов – стрелок, берущих начало в одной точке. Эти векторы располагаются под углом друг к другу, косинус которого и равен коэффициенту корреляции. Косинус угла - это тригонометрическая функция, значение которой можно найти в справочнике. В рамках данной темы мы не будем обсуждать тригонометрическую функцию косинуса, достаточно знать, где найти соответствующие данные.
В таблице 7.1 приводится несколько значений косинусов углов, что даст о них общее представлении.
Таблица 7.1
Таблица косинусов для графического изображения
корреляции между переменными.
В соответствии с данной таблицей полной положительной корреляции (r 1) будет соответствовать угол в 0 (cos 0 1), т.е. графически это будет соответствовать полному совпадению обоих векторов (см. рис. 7.3 а).
Полная отрицательная корреляция (r -1) означает, что оба вектора лежат на одной прямой, но направлены в противоположные стороны (cos 180 -1). (рис. 7.3 б).
Взаимная независимость переменных (r = 0) эквивалентна взаимной перпендикулярности (ортогональности) векторов (cos 90°= 0). (рис. 7.3 в).
Промежуточные значения коэффициента корреляции изображенные в виде пар векторов, образующих либо острые (r > 0), либо тупые (r 0 0 , r 1 180, r -1
V 1
![]()
V 2
а
б
90, r
0 90, r
0 90, r
0
V 2


V 1
Рисунок 7.3. Геометрическая интерпретация коэффициентов корреляции.
Геометрический подход к факторному анализу
Приведенная выше геометрическая интерпретация коэффициента корреляции является основой для графического представления всей корреляционной матрицы и последующей интерпретации данных в факторном анализе .
Построение матрицы начинается с построения вектора, представляющего любую переменную. Другие переменные изображаются с помощью векторов равной длины, причем все они исходят из одной и той же точки. В качестве примера рассмотрим геометрическое выражение корреляций между пятью переменными. (Рис 7.4.)
V 1
V 5 V 2
V 4
Рисунок 7.4. Геометрическая интерпретация корреляционной матрицы (5х5).
Понятно, что не всегда можно представить корреляцию в двух измерениях (на плоскости). Некоторые векторы переменных должны были бы располагаться под углом к странице. Этот факт не является проблемой для собственно математических процедур, однако требует некоторого воображения от читателя. На рисунке 7.5. можно видеть, что корреляция между переменными V1 V2 большая и положительная (т.к между этими векторами маленькие углы). Переменные V2 V3 практически независимы друг от друга, т.к. угол между ними очень близок к 90 , т.е. корреляция равна 0. Переменные V3 - V5 связаны между собой сильно и отрицательно. Высокие корреляции между V1 и V2 являются свидетельством того, что обе эти переменные практически измеряют одно и тоже свойство и что, собственно говоря, одна из этих переменных может быть исключена из дальнейшего рассмотрения без существенной потери информации. Наиболее информативными для нас являются переменные независимые друг от друга, т.е. имеющие между собой минимальные корреляции, или углы соответствующие 90 (рис. 7.5.)
V 1
Рисунок 7.5. Геометрическая интерпретация корреляционной матрицы
Из данного рисунка видно, что существует две группы корреляций: V 1, V 2 , V 3 и V 4 , V5. Корреляции между переменными V 1, V 2 , V 3 очень большие и положительные (между этими векторами маленькие углы, а, следовательно, большие значения косинусов). Аналогично корреляция между переменными V 4 и V 5 тоже большая и положительная. А вот между этими группами переменных корреляция близка нулю, так как эти группы переменных практически ортогональны друг другу, т.е. расположены относительно друг друга под прямым углом. Приведенный пример показывает, что существует две группы корреляций и информация, полученная от этих переменных, может быть аппроксимирована двумя общими факторами (F 1 и F 2), которые в данном случае ортогональны друг другу. Однако так бывает не всегда. Разновидности факторного анализа, в которых вычисляются корреляции между факторами, расположенными не ортогонально, называются облическим решением. Однако такие случаи в рамках данного курса мы не будем рассматривать, и остановимся исключительно на ортогональных решениях.
Измеряя угол между каждым общим фактором и каждой общей переменной, можно вычислить корреляции между этими переменными и соответствующими факторами. Корреляция между переменной и общим фактором обычно называется факторной нагрузкой . Геометрическая интерпретация этого понятия дана на рис. 7.6.
F 2

ФАКТОРНЫЙ АНАЛИЗ
Идея факторного анализа
При исследовании сложных объектов, явлений, систем факторы, определяющие свойства этих объектов, очень часто невозможно измерить непосредственно, а иногда неизвестно даже их число и смысл. Но для измерения могут быть доступны другие величины, так или иначе зависящие от интересующих нас факторов. Причем, когда влияние неизвестного интересующего нас фактора проявляется в нескольких измеряемых признаках или свойствах объекта, эти признаки могут обнаруживать тесную связь между собой и общее число факторов может быть гораздо меньше, чем число измеряемых переменных.
Для выявления факторов, определяющих измеряемые признаки объектов, используются методы факторного анализа
В качестве примера применения факторного анализа можно указать изучение свойств личности на основе психологических тестов. Свойства личности не поддаются прямому измерению. О них можно судить только по поведению человека или характеру ответов на вопросы. Для объяснения результатов опытов их подвергают факторному анализу, который и позволяет выявить те личностные свойства, которые оказывают влияние на поведение индивидуума.
В основе различных методов факторного анализа лежит следующая гипотеза: наблюдаемые или измеряемые параметры являются лишь косвенными характеристиками изучаемого объекта, в действительности существуют внутренние (скрытые, латентные, не наблюдаемые непосредственно) параметры и свойства, число которых мало и которые определяют значения наблюдаемых параметров. Эти внутренние параметры принято называть факторами.
Цель факторного анализа – сконцентрировать исходную информацию, выражая большое число рассматриваемых признаков через меньшее число более ёмких внутренних характеристик явления, которые, однако, не поддаются непосредственному измерению
Установлено, что выделение и последующее наблюдение за уровнем общих факторов даёт возможность обнаруживать предотказные состояния объекта на очень ранних стадиях развития дефекта. Факторный анализ позволяет отслеживать стабильность корреляционных связей между отдельными параметрами. Именно корреляционные связи между параметрами, а также между параметрами и общими факторами содержат основную диагностическую информацию о процессах. Применение инструментария пакета Statistica при выполнении факторного анализа исключает необходимость использования дополнительных вычислительных средств и делает анализ наглядным и понятным для пользователя.
Результаты факторного анализа будут успешными, если удается дать интерпретацию выявленных факторов, исходя из смысла показателей, характеризующих эти факторы. Данная стадия работы весьма ответственная; она требует чёткого представления о содержательном смысле показателей, которые привлечены для анализа и на основе которых выделены факторы. Поэтому при предварительном тщательном отборе показателей для факторного анализа следует руководствоваться их смыслом, а не стремлением к включению в анализ как можно большего их числа.
Сущность факторного анализа
Приведём несколько основных положений факторного анализа. Пусть для матрицы Х измеренных параметров объекта существует ковариационная (корреляционная) матрица C , где р – число параметров, n – число наблюдений. Путем линейного преобразования X =QY +U можно уменьшить размерность исходного факторного пространства Х до уровня Y , при этом р "<<р . Это соответствует преобразованию точки, характеризующей состояние объекта в j -мерном пространстве, в новое пространство измерений с меньшей размерностью р ". Очевидно, что геометрическая близость двух или множества точек в новом факторном пространстве означает стабильность состояния объекта.
Матрица Y содержит ненаблюдаемые факторы, которые по существу являются гиперпараметрами, характеризующими наиболее общие свойства анализируемого объекта. Общие факторы чаще всего выбирают статистически независимыми, что облегчает их физическую интерпретацию. Вектор наблюдаемых признаков Х имеет смысл следствия изменения этих гиперпараметров.
Матрица U
состоит из остаточных факторов, которые включают в основном ошибки измерения признаков x
(i
). Прямоугольная матрица Q
содержит факторные нагрузки, определяющие линейную связь между признаками и гиперпараметрами.
Факторные нагрузки – это значения коэффициентов корреляции каждого из исходных признаков с каждым из выявленных факторов. Чем теснее связь данного признака с рассматриваемым фактором, тем выше значение факторной нагрузки. Положительный знак факторной нагрузки указывает на прямую (а отрицательный знак – на обратную) связь данного признака с фактором.
Таким образом, данные о факторных нагрузках позволяют сформулировать выводы о наборе исходных признаков, отражающих тот или иной фактор, и об относительном весе отдельного признака в структуре каждого фактора.
Модель факторного анализа похожа на модели многомерного регрессионного и дисперсионного анализа. Принципиальное отличие модели факторного анализа в том, что вектор Y – это ненаблюдаемые факторы, а в регрессионном анализе – это регистрируемые параметры. В правой части уравнения (8.1) неизвестными являются матрица факторных нагрузок Q и матрица значений общих факторов Y.
Для нахождения матрицы факторных нагрузок используют уравнениеQQ т =S–V,
где Q т – транспонированная матрица Q, V – матрица ковариаций остаточных факторов U, т.е. . Уравнение решается путем итераций при задании некоторого нулевого приближения ковариационной матрицы V(0).
После нахождения матрицы факторных нагрузок Q вычисляются общие факторы (гиперпараметры) по уравнению
Y=(Q т V -1)Q -1 Q т V -1 X
Пакет статистического анализа Statistica позволяет в диалоговом режиме вычислить матрицу факторных нагрузок, а также значения нескольких заранее заданных главных факторов, чаще всего двух – по первым двум главным компонентам исходной матрицы параметров.
Факторный анализ в системе Statistica
Рассмотрим последовательность выполнения факторного анализа на примере обработки результатов анкетного опроса работников предприятия . Требуется выявить основные факторы, которые определяют качество трудовой жизни.
На первом этапе необходимо отобрать переменные для проведения факторного анализа. Используя корреляционный анализ, исследователь пытается выявить взаимосвязь исследуемых признаков, что, в свою очередь, даёт ему возможность выделить полный и безызбыточный набор признаков путём объединения сильно коррелирующих признаков.
Если проводить факторный анализ по всем переменным, то результаты могут получиться не совсем объективными, так как некоторые переменные определяется другими данными, и не могут регулироваться сотрудниками рассматриваемой организации.
Для того чтобы понять, какие показатели следует исключить, построим по имеющимся данным матрицу коэффициентов корреляции в Statistica: Statistics/ Basic Statistics/ Correlation Matrices/ Ok. В стартовом окне этой процедуры Product-Moment and Partial Correlations (рис. 4.3) для расчёта квадратной матрицы используется кнопка One variable list. Выбираем все переменные (select all), Ok, Summary. Получаем корреляционную матрицу.
Если коэффициент корреляции изменяется в пределах от 0,7 до 1, то это означает сильную корреляцию показателей. В этом случае можно исключить одну переменную с сильной корреляцией. И наоборот, если коэффициент корреляции мал, можно исключить переменную из-за того, что она ничего не добавит к общей сумме. В нашем случае сильной корреляции между какими-либо переменными не наблюдается, и факторный анализ будем проводить для полного набора переменных.
Для запуска факторного анализа необходимо вызвать модуль Statistics/ Multivariate Exploratory Techniques (многомерные исследовательские методы)/ Factor Analysis (факторный анализ). На экране появится окно модуля Factor Analysis.

Для анализа выбираем все переменные электронной таблицы; Variables (переменные): select all, Ok. В строке Input file (тип файла входных данных) указывается Raw Data (исходные данные). В модуле возможны два типа исходных данных – Raw Data (исходные данные) и Correlation Matrix – корреляционная матрица.
В разделе MD deletion задаётся способ обработки пропущенных значений:
* Casewise – способ исключения пропущенных значений (по умолчанию);
* Pairwise – парный способ исключения пропущенных значений;
* Mean substitution – подстановка среднего вместо пропущенных значений.
Способ Casewise состоит в том, что в электронной таблице, содержащей данные, игнорируются все строки, в которых имеется хотя бы одно пропущенное значение. Это относится ко всем переменным. В способе Pairwise игнорируются пропущенные значения не для всех переменных, а лишь для выбранной пары.
Выберем способ обработки пропущенных значений Casewise.
Statistica обработает пропущенные значения тем способом, который указан, вычислит корреляционную матрицу и предложит на выбор несколько методов факторного анализа.
После нажатия кнопки Ok появляется окно Define Method of Factor Extraction (определить метод выделения факторов).
Верхняя часть окна является информационной. Здесь сообщается, что пропущенные значения обработаны методом Casewise. Обработано 17 наблюдений и 17 наблюдений принято для дальнейших вычислений. Корреляционная матрица вычислена для 7 переменных. Нижняя часть окна содержит 3 вкладки: Quick, Advanced, Descriptives.
Во вкладке Descriptives (описательные статистики) имеются две кнопки:
1- просмотреть корреляции, средние и стандартные отклонения;
2- построить множественную регрессию.
Нажав на первую кнопку, можно посмотреть средние и стандартные отклонения, корреляции, ковариации, построить различные графики и гистограммы.
Во вкладке Advanced, в левой части, выберем метод (Extraction method) факторного анализа: Principal components (метод главных компонент). В правой части выбираем максимальное число факторов (2). Задаётся либо максимальное число факторов (Max no of factors), либо минимальное собственное значение: 1 (eigenvalue).
Нажимаем Ok, и Statistica быстро произвёдет вычисления. На экране появляется окно Factor Analysis Results (результаты факторного анализа). Как говорилось ранее, результаты факторного анализа выражаются набором факторных нагрузок. Поэтому далее будем работать с вкладкой Loadings.

Верхняя часть окна – информационная:
Number of variables (число анализируемых переменных): 7;
Method (метод выделения факторов): Principal components (главных компонент);
Log (10) determinant of correlation matrix (десятичный логарифм детерминанта корреляционной матрицы): –1,6248;
Number of factors extracted (число выделенных факторов): 2;
Eigenvalues (собственные значения): 3,39786 и 1,19130.
В нижней части окна находятся функциональные кнопки, позволяющие всесторонне просмотреть результаты анализа, числено и графически.
Factor rotation – вращение факторов, в данном выпадающем окне можно выбрать различные повороты осей. С помощью поворота системы координат можно получить множество решений, из которого необходимо выбрать интерпретируемое решение.
Существуют различные методы вращения координат пространства. Пакет Statistica предлагает восемь таких методов, представленных в модуле факторного анализа. Так, например, метод варимакс соответствует преобразованию координат: вращение, максимизирующее дисперсию. В методе варимакс получают упрощённое описание столбцов факторной матрицы, сводя все значения к 1 или 0. При этом рассматривается дисперсия квадратов нагрузок фактора. Факторная матрица, получаемая с помощью метода вращения варимакс, в большей степени инвариантна по отношению к выбору различных множеств переменных.
Вращение методом квартимакс ставит целью аналогичное упрощение только по отношению к строкам факторной матрицы. Эквимакс занимает промежуточное положение? при вращении факторов по этому методу одновременно делается попытка упростить и столбцы, и строки. Рассмотренные методы вращения относятся к ортогональным вращениям, т.е. в результате получаются некоррелированные факторы. Методы прямого облимина и промакс вращения относятся к косоугольным вращениям, в результате которых получаются коррелированные между собой факторы. Термин?normalized? в названиях методов указывает на то, что факторные нагрузки нормируются, то есть делятся на квадратный корень из соответствующей дисперсии.
Из всех предлагаемых методов, мы сначала посмотрим результат анализа без вращения системы координат – Unrotated. Если полученный результат окажется интерпретируемым и будет нас устраивать, то на этом можно остановиться. Если нет, можно вращать оси и посмотреть другие решения.
Щёлкаем по кнопке "Factor Loading" и смотрим факторные нагрузки численно.

Напомним, что факторные нагрузки – это значения коэффициентов корреляции каждой из переменных с каждым из выявленных факторов.
Значение факторной нагрузки, большее 0,7 показывает, что данный признак или переменная тесно связан с рассматриваемым фактором. Чем теснее связь данного признака с рассматриваемым фактором, тем выше значение факторной нагрузки. Положительный знак факторной нагрузки указывает на прямую (а отрицательный знак? на обратную) связь данного признака с фактором.
Итак, из таблицы факторных нагрузок было выявлено два фактора. Первый определяет ОСБ – ощущение социального благополучия. Остальные переменные обусловлены вторым фактором.
В строке Expl. Var (рис. 8.5) приведена дисперсия, приходящаяся на тот или иной фактор. В строке Prp. Totl приведена доля дисперсии, приходящаяся на первый и второй фактор. Следовательно, на первый фактор приходится 48,5 % всей дисперсии, а на второй фактор – 17,0 % всей дисперсии, всё остальное приходится на другие неучтенные факторы. В итоге, два выявленных фактора объясняют 65,5 % всей дисперсии.

Здесь мы также видим две группы факторов – ОСБ и остальное множество переменных, из которых выделяется ЖСР – желание сменить работу. Видимо, имеет смысл исследовать это желание более основательно на основе сбора дополнительных данных.
Выбор и уточнение количества факторов
Как только получена информация о том, сколько дисперсии выделил каждый фактор, можно возвратиться к вопросу о том, сколько факторов следует оставить. По своей природе это решение произвольно. Но имеются некоторые общеупотребительные рекомендации, и на практике следование им даёт наилучшие результаты.
Количество общих факторов (гиперпараметров) определяется путём вычисления собственных чисел (рис. 8.7) матрицы Х в модуле факторного анализа. Для этого во вкладке Explained variance (рис. 8.4) необходимо нажать кнопку Scree plot. 
Максимальное число общих факторов может быть равно количеству собственных чисел матрицы параметров. Но с увеличением числа факторов существенно возрастают трудности их физической интерпретации.
Сначала можно отобрать только факторы, с собственными значениями, большими 1. По существу, это означает, что если фактор не выделяет дисперсию, эквивалентную, по крайней мере, дисперсии одной переменной, то он опускается. Этот критерий используется наиболее широко. В приведённом выше примере на основе этого критерия следует сохранить только 2 фактора (две главные компоненты).
Можно найти такое место на графике, где убывание собственных значений слева направо максимально замедляется. Предполагается, что справа от этой точки находится только "факториальная осыпь". В соответствии с этим критерием можно оставить в примере 2 или 3 фактора.
Из рис. видно, что третий фактор незначительно увеличивает долю общей дисперсии.
Факторный анализ параметров позволяет выявить на ранней стадии нарушение рабочего процесса (возникновение дефекта) в различных объектах, которое часто невозможно заметить путём непосредственного наблюдения за параметрами. Это объясняется тем, что нарушение корреляционных связей между параметрами возникает значительно раньше, чем изменение одного параметра. Такое искажение корреляционных связей позволяет своевременно обнаружить факторный анализ параметров. Для этого достаточно иметь массивы зарегистрированных параметров.
Можно дать общие рекомендации по использованию факторного анализа вне зависимости от предметной области.
* На каждый фактор должно приходиться не менее двух измеренных параметров.
* Число измерений параметров должно быть больше числа переменных.
* Количество факторов должно обосновываться, исходя из физической интерпретации процесса.
* Всегда следует добиваться того, чтобы количество факторов было намного меньше числа переменных.
Критерий Кайзера иногда сохраняет слишком много факторов, в то время как критерий каменистой осыпи иногда сохраняет слишком мало факторов. Однако оба критерия вполне хороши при нормальных условиях, когда имеется относительно небольшое число факторов и много переменных. На практике более важен вопрос о том, когда полученное решение может быть интерпретировано. Поэтому обычно исследуется несколько решений с большим или меньшим числом факторов, и затем выбирается одно наиболее осмысленное.
Пространство исходных признаков должно быть представлено в однородных шкалах измерения, т. к. это позволяет при вычислении использовать корреляционные матрицы. В противном случае возникает проблема "весов" различных параметров, что приводит к необходимости применения при вычислении ковариационных матриц. Отсюда может появиться дополнительная проблема повторяемости результатов факторного анализа при изменении количества признаков. Следует отметить, что указанная проблема просто решается в пакете Statistica путем перехода к стандартизированной форме представления параметров. При этом все параметры становятся равнозначными по степени их связи с процессами в объекте исследования.
Если в наборе исходных данных имеются избыточные переменные и не проведено их исключение корреляционным анализом, то нельзя вычислить обратную матрицу (8.3). Например, если переменная является суммой двух других переменных, отобранных для этого анализа, то корреляционная матрица для такого набора переменных не может быть обращена, и факторный анализ принципиально не может быть выполнен. На практике это происходит, когда пытаются применить факторный анализ к множеству сильно зависимых переменных, что иногда случается, например, в обработке вопросников. Тогда можно искусственно понизить все корреляции в матрице путём добавления малой константы к диагональным элементам матрицы, и затем стандартизировать её. Эта процедура обычно приводит к матрице, которая может быть обращена, и поэтому к ней применим факторный анализ. Более того, эта процедура не влияет на набор факторов, но оценки оказываются менее точными.
Факторное и регрессионное моделирование систем с переменными состояниямиСистемой с переменными состояниями (СПС) называется система, отклик которой зависит не только от входного воздействия, но и от обобщенного постоянного во времени параметра, определяющего состояние. Регулируемый усилитель или аттенюатор? это пример простейшей СПС, в котором коэффициент передачи может дискретно или плавно изменяться по какому-либо закону. Исследование СПС обычно проводится для линеаризованных моделей, в которых переходный процесс, связанный с изменением параметра состояния, считается завершённым.
Аттенюаторы, выполненные на основе Г-, Т- и П-образного соединения последовательно и параллельно включённых диодов получили наибольшее распространение. Сопротивление диодов под воздействием управляющего тока может меняться в широких пределах, что позволяет изменять АЧХ и затухание в тракте. Независимость фазового сдвига при регулировании затухания в таких аттенюаторах достигается с помощью реактивных цепей, включенных в базовую структуру. Очевидно, что при разном соотношении сопротивлений параллельных и последовательных диодов может быть получен один и тот же уровень вносимого ослабления. Но изменение фазового сдвига будет различным.
Исследуем возможность упрощения автоматизированного проектирования аттенюаторов, исключающего двойную оптимизацию корректирующих цепей и параметров управляемых элементов. В качестве исследуемой СПС будем использовать электрически управляемый аттенюатор, схема замещения которого приведена на рис. 8.8. Минимальный уровень затухания обеспечивается в случае малого сопротивления элемента Rs и большого сопротивления элемента Rp. По мере увеличения сопротивления элемента Rs и уменьшения сопротивления элемента Rp вносимое ослабление увеличивается.

Зависимости изменения фазового сдвига от частоты и затухания для схемы без коррекции и с коррекцией приведены на рис. 8.9 и 8.10 соответственно. В корректированном аттенюаторе в диапазоне ослаблений 1,3-7,7 дБ и полосе частот 0,01?4,0 ГГц достигнуто изменение фазового сдвига не более 0,2°. В аттенюаторе без коррекции изменение фазового сдвига в той же полосе частот и диапазоне ослаблений достигает 3°. Таким образом, фазовый сдвиг уменьшен за счет коррекции почти в 15 раз.


Будем считать параметры коррекции и управления независимыми переменными или факторами, влияющими на затухание и изменение фазового сдвига. Это даёт возможность с помощью системы Statistica провести факторный и регрессионный анализ СПС с целью установления физических закономерностей между параметрами цепи и отдельными характеристиками, а также упрощения поиска оптимальных параметров схемы.
Исходные данные формировались следующим образом. Для параметров коррекции и сопротивлений управления, отличающихся от оптимальных в большую и меньшую стороны на сетке частот 0,01?4 ГГц, были вычислены вносимое ослабление и изменение фазового сдвига.
Методы статистического моделирования, в частности, факторный и регрессионный анализ, которые раньше не использовались для проектирования дискретных устройств с переменными состояниями, позволяют выявить физические закономерности работы элементов системы. Это способствует созданию структуры устройства исходя из заданного критерия оптимальности. В частности, в данном разделе рассматривался фазоинвариантный аттенюатор как типичный пример системы с переменными состояниями. Выявление и интерпретация факторных нагрузок, влияющих на различные исследуемые характеристики, позволяет изменить традиционную методологию и существенно упростить поиск параметров коррекции и параметров регулирования.
Установлено, что использование статистического подхода к проектированию подобных устройств оправдано как для оценки физики их работы, так и для обоснования принципиальных схем. Статистическое моделирование позволяет существенно сократить объём экспериментальных исследований.
Результаты
- Наблюдение за общими факторами и соответствующими факторными нагрузками – это необходимое выявление внутренних закономерностей процессов.
- С целью определения критических значений контролируемых расстояний между факторными нагрузками следует накапливать и обобщать результаты факторного анализа для однотипных процессов.
- Применение факторного анализа не ограничено физическими особенностями процессов. Факторный анализ является как мощным методом мониторинга процессов, так и применим к проектированию систем самого различного назначения.
Экономическая наука кроме своих специфических методов использует также и некоторые общенаучные методы - синтез, анализ, сравнения, абстракции и много другое. Одним из видов экономического анализа является факторный анализ, который представляет собой мощный инструмент, позволяющий не только разложить то или иное на составляющие, но и определить, какая составляющая оказывает то или иное влияние на процесс в целом. Более детально данный вид анализа рассмотрим в данной статье.
По определению, факторный анализ - это вид математического нескольких переменных, который позволяет определить, какое влияние на функцию оказывает та или иная переменная. Почему так важен именно в экономике? Все потому, что ни один не является зависимым лишь от одного фактора. Так, цена зависит от спроса и предложения, заработная плата - от трудоспособности сотрудника и отработанного времени, прибыль предприятия - от совокупности всех показателей деятельности фирмы вместе взятых. Но как определить, какой из факторов оказывает ключевое влияние на тот или иной показатель? Именно здесь нам пригодится факторный анализ.
Начнем с простого примера. Попробуем произвести факторный анализ себестоимости. На себестоимость продукции оказывают влияние такие факторы, как стоимость сырья, заработная плата рабочих, амортизация оборудования в расчете на единицу продукции.Выходит, что себестоимость является функцией от всех этих факторов, и, по сути, является суммой стоимостей всех затрат. Таким образом, возрастание каждого из этих видов затрат приведет к росту себестоимости единицы продукции. Логично предположить, что стоимость сырья в большинстве случаев занимает наибольшую долю в себестоимости продукции. Можем сделать вывод, что именно она оказывает наибольшее влияние на себестоимость, и значит, именно на поиске более дешевого сырья необходимо сконцентрироваться поиске резервов снижения себестоимости.
Попробуем произвести факторный Тут все несколько сложнее, ведь есть факторы, способствующие как росту, так и снижению производительности. Среди факторов, способствующих росту - качество и надежность оборудования, квалификация персонала, удобство работы персонала, соотношение рабочего времени и перерывов в работе. Среди факторов, снижающих производительность - количество случаев выхода оборудования из строя, наличие «узких мест» - участков производства с недостаточной производственной мощностью, отвлекающие факторы - шумы, вибрации и прочие внешние раздражители. Конечно же, все вышеуказанные факторы будут иметь в функции различные коэффициенты, и именно с их помощью будет выражаться степень влияния того или иного фактора на производительность труда, однако общий принцип понятен: действие факторов, повышающих производительность, необходимо усиливать, а факторов, понижающих эффективность труда - минимизировать.
Проведя факторный анализ того или иного явления в экономике, можно составить некий план действий, согласно которому можно будет с минимальными затратами времени и ресурсов максимизировать или минимизировать некоторые показатели деятельности фирмы. Это поможет в кратчайшие сроки сделать так, чтобы фирма работала максимально эффективно и прибыльно. Широко применяется факторный анализ и в макроэкономике - анализируется объем ВВП, соотношение экспорта и импорта, вычисляется необходимое количество в обращении и многие другие показатели эффективности функционирования экономики страны.
