Далее: ПРАКТИЧЕСКАЯ РАБОТА 12. МНОЖЕСТВЕННЫЙ Вверх: Методические рекомендации Назад: ПРАКТИЧЕСКАЯ РАБОТА 10. СПОСОБЫ


ПРАКТИЧЕСКАЯ РАБОТА 11.
ФАКТОРНЫЙ АНАЛИЗ

Цель: сформировать умение обрабатывать, интерпретировать и представлять результаты факторного анализа.

Основные понятия:

1. Факторный анализ (ФА) - метод, позволяющий свести большое количество исходных переменных к значительно меньшему числу факторов, каждый из которых объединяет исходные переменные, имеющие сходный смысл.

Цель факторного анализа - уменьшение размерности исходных данных с целью их экономного описания при условии минимальных потерь исходной информации.

Задачи ФА:

1. Исследование структуры взаимосвязей переменных. В этом случае каждая группировка переменных будет определяться фактором, по которому эти переменные имеют максимальные нагрузки.

2. Идентификация факторов как скрытых (латентных) переменных - причин взаимосвязей исходных переменных.

3. Вычисление значений факторов для испытуемых как новых, интегральных переменных. При этом число факторов существенно меньше числа переменных.

Результатом ФА является переход от множества исходных переменных к существенно меньшему числу новых переменных - факторов.

2. Фактор - в факторном анализе объединение нескольких переменных, чья взаимная корреляция исчерпывает определенную долю общей дисперсии. После процедуры вращения каждый фактор интерпретируется как некоторая общая причина взаимосвязи группы переменных.

3. Факторная структура - основной результат применения ФА. Элементы факторной структуры - факторные нагрузки переменных.

4. Метод главных компонент - метод, который лежит в основе большинства методов ФА. Он преобразует набор коррелирующих исходных переменных в другой набор - некоррелирующих переменных. Анализ главных компонент можно представить как преобразование информации, содержащейся в исходных данных. Так, определяя главную компоненту как направление, в котором наблюдается наибольший разброс объектов, представляя объекты в единицах измерения по этой оси, мы теряем минимум информации об отличии объектов друг от друга.

5. Вращение факторов - математическая процедура, позволяющая объяснить содержательный смысл выделенных на предыдущем этапе главных компонент, объясняющих большую часть общей дисперсии переменных.

6. Варимакс вращение - наиболее распространенный метод вращения, при котором факторы остаются независимыми или ортогональными по отношению друг к другу, так что баллы испытуемых по одному фактору не коррелируют с баллами по другим факторам.

Весь процесс ФА можно представить как выполнение нескольких $этапов$:

1. Факторизация матрицы интеркорреляций.

2. Извлечение факторов, решение проблемы числа факторов.

3. Вращение факторов для создания упрощенной структуры.

4. Интерпретация факторов.

Файлы-примеры:

1. SPSS 46 ДЗ.

2. SPSS 47 ДЗ.

Результат выполнения заданий: умение обрабатывать, интерпретировать и представлять результаты ФА.

Задания для работы:

Задание 1. Откройте "Файл SPSS 46 ДЗ".

Для примера используются 6 переменных (вопросы, связанные с проявлением тревожности, депрессии), хотя в большинстве случаев использования ФА оперируют большим количеством переменных:

"Трев1" - я испытываю тревогу

"Трев2" - я становлюсь напряженным

"Трев3" - я спокоен

"Деп1" - я подавлен

"Деп2" - я чувствую себя бесполезным

"Деп3" - я счастлив

Проведите вычисления и интерпретацию, связанную с ФА.

Выполните следующий порядок действий:

Шаг 1. На панели инструментов выберите меню Анализ$ \to
$Обработка данных$ \to
$Фактор...

Шаг 2. В открывшемся диалоговом окне из левой части окна переместите в правую все переменные, необходимые для ФА.

Шаг 3. Выберите меню Описания$ \to
$в группе операций Стат установите флажок Одномерные дисперсии$ \to
$в группе Матрица корреляций установите флажки Коэффициенты$ \to
$КМО и испытание Bartlett шарообразности$ \to
$выберите Продолжить.

Шаг 4. В открытом окне (Факторный анализ) выберите Извлечение$ \to
$Метод$ \to
$Главные компоненты (если он не установлен по умолчанию)$ \to
$отметьте Scree plot$ \to
$выберите Продолжить.

Шаг 5. В открытом окне (Факторный анализ) выберите Вращение...$ \to
$в группе Метод установите флажок Varimax$ \to
$в группе Отображение установите флажок Вращаемое решение Загрузка графика(ов)$ \to
$выберите Продолжить.

Шаг 6. В диалоговом окне (Факторный анализ) выберите Установки. Установите флажок Отсортированные по размеру$ \to
$выберите Продолжить.

Шаг 6. В открытом окне (Факторный анализ) выберите ОК, чтобы открыть окно вывода.

В результате (в окне вывода) представлены следующие параметры: одномерные описательные статистики для всех переменных, коэффициенты корреляции, критерии многомерной нормальности и адекватности выборки, матрица факторной структуры до и после вращения, график собственных значений и график факторной структуры после вращения.

Если требуется установить количество извлекаемых факторов:

Процедура обработки та же, но в диалоговом окне Факторный анализ нажимаем кнопку Извлечение. В открывшемся окне диалога убеждаемся, что по умолчанию установлено Главные компоненты. Флажком отмечаем График собственных значений, в группе Извлечение устанавливаем флажок Количество факторов и указываем предполагаемое количество. Нажимаем Продолжить.

Анализ результатов:

Определение числа главных компонент (факторов):

для определения числа компонент предложено два критерия. В соответствии с первым число факторов равно числу компонент, собственные значения которых больше 1 (таблица "Полная объясненная дисперсия"). Второй критерий определяется по графику собственных значений (Scree plot) - количество факторов определяется по точке перегиба на графике до его выхода на пологую прямую после резкого спада собственных значений.

Окончательное решение о числе факторов принимается только после первичной интерпретации факторной структуры.

Критерий адекватности выборки Кайзера-Мейера-Олкина (таблица "Мера адекватности и критерий Бартлетта") - величина, характеризующая степень применимости факторного анализа к данной выборке. Правило интерпретации этого критерия следующее:

- более 0,9 - безусловная адекватность;

- более 0,8 - высокая адекватность;

- более 0,7 - приемлемая адекватность;

- более 0,6 - удовлетворительная адекватность;

- более 0,5 - низкая адекватность;

- менее 0,5 - факторный анализ неприменим к выборке.

Критерий сферичности Бартлетта (таблица "Мера адекватности и критерий Бартлетта") - критерий многомерной нормальности для распределения переменных. Помимо нормальности критерий проверяет, отличаются ли корреляции от 0. Значение $p$, меньшее 0,05, указывает на то, что данные вполне приемлемы для проведения факторного анализа.

Описание и интерпретация результатов:

Интерпретация факторов производится по таблице факторных нагрузок после вращения (таблица "Матрица повернутых компонент") в следующем порядке:

1. По каждой переменной (строке) выделяется наибольшая по абсолютной величине нагрузка - как доминирующая. Если вторая по величине нагрузка в строке отличается от уже выделенной менее чем на 0,2, то и она выделяется, но как второстепенная.

2. После просмотра всех строк - переменных, просмотрите столбцы - факторы. По каждому фактору выписывают наименования (обозначения) переменных, имеющих наибольшие нагрузки по этому фактору. При этом обязательно учитывается знак факторной нагрузки переменной: если знак отрицательный, это отмечается как противоположный полюс фактора. 3. После такого просмотра всех факторов каждому из них присваивается наименование, обобщающее по смыслу включенные в него переменные.

Если трудно подобрать термин из соответствующей теории, допускается наименование фактора по имени переменной, имеющей по сравнению с другими наибольшую нагрузку по этому фактору.

Пример описания результатов ФА:

Корреляционная матрица ...переменных (указать количество) была подвергнута процедуре анализа по методу главных компонент. Было извлечено ...факторов (указать количество) с собственными значениями больше единицы. Эти факторы подверглись вращению по методу варимакс. Первый фактор можно интерпретировать как ...(указать название), так как переменные, связанные с эти явлением, имеют по нему самые высокие нагрузки. Второй фактор можно интерпретировать как ...(указать название), так как переменные, связанные с этим явлением, имеют по нему самые высокие нагрузки и т.д. Факторы, полученные в результате вращения по методу варимакс, объясняют ...(указать процент) совокупной (общей) дисперсии.

Задание 2. Откройте "Файл SPSS 47 ДЗ".

Условия задачи:

1. В примере использованы данные реального тестирования интеллекта школьников (n=46). 2. Тест включал в себя 11 субтестов (переменные "и1", "и2"..., "и11"), наименования которых представлены в файле во вкладке "Обзор переменных".

3. Предполагалось, что эти 11 субтестов позволяют измерить обобщенные интеллектуальные характеристики: математические, вербальные, образные и т.д.

Проведите вычисления и интерпретацию, связанную с ФА.


Далее: ПРАКТИЧЕСКАЯ РАБОТА 12. МНОЖЕСТВЕННЫЙ Вверх: Методические рекомендации Назад: ПРАКТИЧЕСКАЯ РАБОТА 10. СПОСОБЫ

ЯГПУ, Отдел образовательных информационных технологий
05.03.2011