Цель: сформировать умение обрабатывать, интерпретировать и представлять результаты факторного анализа.
Основные понятия:
1. Факторный анализ (ФА) - метод, позволяющий свести большое количество исходных переменных к значительно меньшему числу факторов, каждый из которых объединяет исходные переменные, имеющие сходный смысл.
Цель факторного анализа - уменьшение размерности исходных данных с целью их экономного описания при условии минимальных потерь исходной информации.
Задачи ФА:
1. Исследование структуры взаимосвязей переменных. В этом случае каждая группировка переменных будет определяться фактором, по которому эти переменные имеют максимальные нагрузки.
2. Идентификация факторов как скрытых (латентных) переменных - причин взаимосвязей исходных переменных.
3. Вычисление значений факторов для испытуемых как новых, интегральных переменных. При этом число факторов существенно меньше числа переменных.
Результатом ФА является переход от множества исходных переменных к существенно меньшему числу новых переменных - факторов.
2. Фактор - в факторном анализе объединение нескольких переменных, чья взаимная корреляция исчерпывает определенную долю общей дисперсии. После процедуры вращения каждый фактор интерпретируется как некоторая общая причина взаимосвязи группы переменных.
3. Факторная структура - основной результат применения ФА. Элементы факторной структуры - факторные нагрузки переменных.
4. Метод главных компонент - метод, который лежит в основе большинства методов ФА. Он преобразует набор коррелирующих исходных переменных в другой набор - некоррелирующих переменных. Анализ главных компонент можно представить как преобразование информации, содержащейся в исходных данных. Так, определяя главную компоненту как направление, в котором наблюдается наибольший разброс объектов, представляя объекты в единицах измерения по этой оси, мы теряем минимум информации об отличии объектов друг от друга.
5. Вращение факторов - математическая процедура, позволяющая объяснить содержательный смысл выделенных на предыдущем этапе главных компонент, объясняющих большую часть общей дисперсии переменных.
6. Варимакс вращение - наиболее распространенный метод вращения, при котором факторы остаются независимыми или ортогональными по отношению друг к другу, так что баллы испытуемых по одному фактору не коррелируют с баллами по другим факторам.
Весь процесс ФА можно представить как выполнение нескольких :
1. Факторизация матрицы интеркорреляций.
2. Извлечение факторов, решение проблемы числа факторов.
3. Вращение факторов для создания упрощенной структуры.
4. Интерпретация факторов.
Файлы-примеры:
1. SPSS 46 ДЗ.
2. SPSS 47 ДЗ.
Результат выполнения заданий: умение обрабатывать, интерпретировать и представлять результаты ФА.
Задания для работы:
Задание 1. Откройте "Файл SPSS 46 ДЗ".
Для примера используются 6 переменных (вопросы, связанные с проявлением тревожности, депрессии), хотя в большинстве случаев использования ФА оперируют большим количеством переменных:
"Трев1" - я испытываю тревогу
"Трев2" - я становлюсь напряженным
"Трев3" - я спокоен
"Деп1" - я подавлен
"Деп2" - я чувствую себя бесполезным
"Деп3" - я счастлив
Проведите вычисления и интерпретацию, связанную с ФА.
Выполните следующий порядок действий:
Шаг 1. На панели инструментов выберите меню АнализОбработка данныхФактор...
Шаг 2. В открывшемся диалоговом окне из левой части окна переместите в правую все переменные, необходимые для ФА.
Шаг 3. Выберите меню Описанияв группе операций Стат установите флажок Одномерные дисперсиив группе Матрица корреляций установите флажки КоэффициентыКМО и испытание Bartlett шарообразностивыберите Продолжить.
Шаг 4. В открытом окне (Факторный анализ) выберите ИзвлечениеМетодГлавные компоненты (если он не установлен по умолчанию)отметьте Scree plotвыберите Продолжить.
Шаг 5. В открытом окне (Факторный анализ) выберите Вращение...в группе Метод установите флажок Varimaxв группе Отображение установите флажок Вращаемое решение Загрузка графика(ов)выберите Продолжить.
Шаг 6. В диалоговом окне (Факторный анализ) выберите Установки. Установите флажок Отсортированные по размерувыберите Продолжить.
Шаг 6. В открытом окне (Факторный анализ) выберите ОК, чтобы открыть окно вывода.
В результате (в окне вывода) представлены следующие параметры: одномерные описательные статистики для всех переменных, коэффициенты корреляции, критерии многомерной нормальности и адекватности выборки, матрица факторной структуры до и после вращения, график собственных значений и график факторной структуры после вращения.
Если требуется установить количество извлекаемых факторов:
Процедура обработки та же, но в диалоговом окне Факторный анализ нажимаем кнопку Извлечение. В открывшемся окне диалога убеждаемся, что по умолчанию установлено Главные компоненты. Флажком отмечаем График собственных значений, в группе Извлечение устанавливаем флажок Количество факторов и указываем предполагаемое количество. Нажимаем Продолжить.
Анализ результатов:
Определение числа главных компонент (факторов):
для определения числа компонент предложено два критерия. В соответствии с первым число факторов равно числу компонент, собственные значения которых больше 1 (таблица "Полная объясненная дисперсия"). Второй критерий определяется по графику собственных значений (Scree plot) - количество факторов определяется по точке перегиба на графике до его выхода на пологую прямую после резкого спада собственных значений.
Окончательное решение о числе факторов принимается только после первичной интерпретации факторной структуры.
Критерий адекватности выборки Кайзера-Мейера-Олкина (таблица "Мера адекватности и критерий Бартлетта") - величина, характеризующая степень применимости факторного анализа к данной выборке. Правило интерпретации этого критерия следующее:
- более 0,9 - безусловная адекватность;
- более 0,8 - высокая адекватность;
- более 0,7 - приемлемая адекватность;
- более 0,6 - удовлетворительная адекватность;
- более 0,5 - низкая адекватность;
- менее 0,5 - факторный анализ неприменим к выборке.
Критерий сферичности Бартлетта (таблица "Мера адекватности и критерий Бартлетта") - критерий многомерной нормальности для распределения переменных. Помимо нормальности критерий проверяет, отличаются ли корреляции от 0. Значение , меньшее 0,05, указывает на то, что данные вполне приемлемы для проведения факторного анализа.
Описание и интерпретация результатов:
Интерпретация факторов производится по таблице факторных нагрузок после вращения (таблица "Матрица повернутых компонент") в следующем порядке:
1. По каждой переменной (строке) выделяется наибольшая по абсолютной величине нагрузка - как доминирующая. Если вторая по величине нагрузка в строке отличается от уже выделенной менее чем на 0,2, то и она выделяется, но как второстепенная.
2. После просмотра всех строк - переменных, просмотрите столбцы - факторы. По каждому фактору выписывают наименования (обозначения) переменных, имеющих наибольшие нагрузки по этому фактору. При этом обязательно учитывается знак факторной нагрузки переменной: если знак отрицательный, это отмечается как противоположный полюс фактора. 3. После такого просмотра всех факторов каждому из них присваивается наименование, обобщающее по смыслу включенные в него переменные.
Если трудно подобрать термин из соответствующей теории, допускается наименование фактора по имени переменной, имеющей по сравнению с другими наибольшую нагрузку по этому фактору.
Пример описания результатов ФА:
Корреляционная матрица ...переменных (указать количество) была подвергнута процедуре анализа по методу главных компонент. Было извлечено ...факторов (указать количество) с собственными значениями больше единицы. Эти факторы подверглись вращению по методу варимакс. Первый фактор можно интерпретировать как ...(указать название), так как переменные, связанные с эти явлением, имеют по нему самые высокие нагрузки. Второй фактор можно интерпретировать как ...(указать название), так как переменные, связанные с этим явлением, имеют по нему самые высокие нагрузки и т.д. Факторы, полученные в результате вращения по методу варимакс, объясняют ...(указать процент) совокупной (общей) дисперсии.
Задание 2. Откройте "Файл SPSS 47 ДЗ".
Условия задачи:
1. В примере использованы данные реального тестирования интеллекта школьников (n=46). 2. Тест включал в себя 11 субтестов (переменные "и1", "и2"..., "и11"), наименования которых представлены в файле во вкладке "Обзор переменных".
3. Предполагалось, что эти 11 субтестов позволяют измерить обобщенные интеллектуальные характеристики: математические, вербальные, образные и т.д.
Проведите вычисления и интерпретацию, связанную с ФА.