Пусть объекты генеральной совокупности обладают двумя качественными признаками и выборка объема содержит независимые объекты, которые будем располагать (ранжировать) в порядке ухудшения (или улучшения) качества. Для оценки степени связи признаков вводят коэффициенты ранговой корреляции Спирмена и Кендалла. Рассматривая ранги , , ..., как возможные значения случайной величины , а , , ... , - как возможные значения с.в. , можно вычислить выборочный коэффициент корреляции.
Пример 176. Получить выборочный коэффициент ранговой корреляции Спирмена
.
Решение. Примем в качестве условных вариант отклонения , и вычислим выборочный коэффициент корреляции
Тогда и надо найти и .
Найдем и .
Поскольку , то , и
(использовали формулы конечных сумм из [15. С. 72-74]).
Тогда и
Выразим теперь через и .
Отсюда и
Покажем эффективность использования полученного коэффициента ранговой корреляции Спирмена на следующем примере.
Пример 177. Знания 10 студентов проверены по двум тестам, А и В. Оценки по стобалльной системе оказались следующими:
Тест А | 95 90 87 84 75 70 61 60 58 55 |
Тест В | 92 94 83 79 58 61 47 72 62 68 |
Найдите выборочный коэффициент ранговой корреляции Спирмена между оценками по двум тестам.
Решение. Запишем ранги студентов по тестам и квадраты их разностей:
ранг по тесту А | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 |
ранг по тесту В | 2 | 1 | 3 | 4 | 9 | 8 | 10 | 5 | 7 | 6 |
1 | 1 | 0 | 0 | 16 | 4 | 9 | 9 | 4 | 16 |
Тогда и
В психолого-педагогических исследованиях достаточно часто используется ранговая корреляция Спирмена, поэтому приведем здесь алгоритм ее применения и пример из диссертационного исследования по психологии.
Проранжировать значения первой переменной , начисляя ранг 1 наименьшему значению, и записать ранги в первый столбец по порядку номеров испытуемых или по возрастанию ранга, при равных переменных им присваивается одинаковый среднеарифметический ранг.
Проранжировать значения второй переменной по тем же правилам и занести соответствующие ранги во второй столбец.
Подсчитать разности между рангами и по каждой строке и занести их в третий столбец.
Квадраты занести в четвертый столбец и подсчитать их сумму .
При наличии одинаковых рангов рассчитать поправки:
где - объем каждой группы одинаковых рангов в ранговых рядах и.
Рассчитать коэффициент ранговой корреляции Спирмена по формуле:
а) , при отсутствии одинаковых рангов;
б) при наличии одинаковых рангов
где - количество испытуемых, участвовавших в ранжировании.
7. Определить по таблице критические значения для данного . Если , то корреляция достоверно отличается от 0 (этот пункт будет рассмотрен в следующем параграфе).
Пример 178. Найти коэффициент ранговой корреляции Спирмена по связи эмоционального состояния и зрительной памяти после иппотерапии по результатам исследования.
Количество выборов, соответствующее положительному эмоциональному состоянию | Зрительная память | ||||
баллы | ранг | баллы | ранг | ||
3 | 19.5 | 6 | 22 | -2,5 | 6,25 |
3 | 19,5 | 5 | 14 | 5,5 | 30,25 |
2 | 10,5 | 5 | 14 | -3,5 | 12,25 |
1 | 3,5 | 3 | 3 | 0,5 | 0,25 |
3 | 19,5 | 5 | 14 | 5,5 | 30,25 |
2 | 10,5 | 5 | 14 | -3,5 | 12,25 |
1 | 3,5 | 4 | 7 | -3,5 | 12,25 |
1 | 3,5 | 3 | 3 | 0,5 | 0,25 |
3 | 19,5 | 6 | 22 | -2,5 | 6,25 |
2 | 10,5 | 3 | 3 | 7,5 | 56,25 |
3 | 19,5 | 5 | 14 | 5,5 | 30,25 |
2 | 10,5 | 5 | 14 | -3,5 | 12,25 |
3 | 19,5 | 6 | 22 | -2,5 | 6,25 |
2 | 10,5 | 6 | 22 | 11,5 | 132,25 |
3 | 19,5 | 5 | 14 | 5,5 | 30,25 |
3 | 19,5 | 6 | 22 | -2,5 | 6,25 |
2 | 10,5 | 5 | 14 | -3,5 | 12,25 |
3 | 19,5 | 4 | 7 | 12,5 | 156,25 |
2 | 10,5 | 5 | 14 | -3,5 | 12,25 |
1 | 3,5 | 4 | 7 | -3,5 | 12,25 |
1 | 3,5 | 3 | 3 | 0,5 | 0,25 |
1 | 3,5 | 3 | 3 | 0,5 | 0,25 |
2 | 10,5 | 5 | 14 | -3,5 | 12,25 |
3 | 19,5 | 5 | 14 | 5,5 | 30,25 |
620 | |||||
r = | 0,611 |
при
- отвергается.
Связь между двумя качественными признаками можно оценить, используя выборочный коэффициент ранговой корреляции Кендалла:
и - число рангов , ..., , больших .
Пример 179. Определите степень связи итогов чемпионата России по футболу в премьер-лиге и результаты первого круга 2002 года.
Команда | Локо | ЦСКА | Спартак | Торпедо | Кр. Сов. | Сатурн | Шинник | Динамо | Ротор | Зенит |
Итог 2002 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 |
круг | 1 | 2 | 3 | 10 | 6 | 4 | 8 | 7 | 5 | 9 |
Решение. Определим степень связи по выборочному коэффициенту ранговой корреляции Кендалла.
= 9, = 8, = 7, = 0, = 3, = 4, = 1, = 1, = 1, тогда , , a
и между итогом чемпионата и результатом первого круга существует прямая средней тесноты связь.
Если статистическая информация о многомерном признаке представлена в порядковой шкале, то измерение парных связей осуществляется через коэффициенты ранговой корреляции Кендалла или Спирмена.
Пример 180. Три арбитра оценили мастерство 10 фигуристов, в итоге были получены три последовательности рангов:
Ранг арбитра А | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 |
Ранг арбитра В | 3 | 10 | 6 | 2 | 8 | 5 | 7 | 9 | 1 | 4 |
Ранг арбитра С | 6 | 3 | 1 | 2 | 9 | 4 | 5 | 7 | 10 | 8 |
Найдите матрицу ранговой корреляции Спирмена и пару арбитров, оценки которых наиболее согласуются.
Решение. Найдем , вычислив сумму квадратов разностей рангов арбитров А и В.
и аналогично находим, что и , а искомая матрица ранговой корреляции Спирмена выглядит следующим образом
Поскольку коэффициент является максимальным, то оценки арбитров А и С наиболее согласуются.
Вопросы для самоконтроля
Задачи
I. 351. Специалисты двух заводов проранжировали 8 факторов, влияющих на ход технологического процесса. В итоге были получены две последовательности рангов:
1 2 3 4 5 6 7 8
1 2 4 3 8 7 5 6
Определите, согласуются ли мнения специалистов различных заводов, используя коэффициент ранговой корреляции Спирмена.
352. Получены рейтинги строительства жилья в регионах Центрального федерального округа в 2001 и 2002 годах:
Область | Московская | Тверская | Орловская | Тульская | Рязанская | Владимирская | Калужская | Ярославская | Костромская | Ивановская |
2001 г. | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 |
2002 г. | 1 | 3 | 2 | 9 | 7 | 4 | 8 | 6 | 5 | 10 |
Найдите коэффициент ранговой корреляции Спирмена для строительства жилья в 2001 и 2002 годах по 10 регионам РФ.
353. Установить, как коррелируют результаты чемпионата России по хоккею в суперлиге по итогам двух кругов чемпионата 2001 и 2002 годов:
Команда | Ак Барс | Авангард | Мет. М. | Лада | Сев. Ч. | Неф. | Локо. | Мечел | Амур | Мет. Нк. | ЦСКА | Динамо |
Место 2001 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 |
Место 2002 | 4 | 3 | 7 | 5 | 2 | 11 | 1 | 12 | 9 | 8 | 10 | 6 |
354. По данным статистического сборника "Социальная сфера регионов Центральной России", денежные доходы и потребительские расходы в расчете на душу населения в ноябре 2002 года составили:
Области | Брянская | Владимирская | Ивановская | Калужская | Костромская | Московская | Орловская | Рязанская | Тверская | Ярославская |
Доходы (руб.) | 2542 | 2256 | 1793 | 2633 | 2440 | 3631 | 2614 | 2726 | 2416 | 3630 |
Расходы (руб.) | 1666 | 1259 | 1241 | 1693 | 1459 | 2788 | 1868 | 1673 | 1620 | 1902 |
Проранжируйте полученные данные и найдите коэффициент ранговой корреляции Кенделла для доходов и расходов на душу населения в областях Центрального федерального округа.
355. За пять лет ввод общей площади (в тыс. кв. м) жилых домов в области и в городе Ярославле характеризуются следующими данными:
Год | 1997 | 1998 | 1999 | 2000 | 2001 |
Яр. область | 222,6 | 231,7 | 221 | 130,6 | 162,3 |
г. Ярославль | 118,6 | 119,7 | 113,3 | 66,5 | 89 |
Что можно сказать о степени зависимости ввода жилья в Ярославской области и в городе Ярославле?
356. Двенадцать цветных полос расположены в порядке убывания окраски от темной к светлой, и каждой полосе присвоен ранг - порядковый номер. При проверке способности различать оттенки цветов испытуемый расположил полосы в следующем порядке:
: 6, 3, 4, 2, 1, 10, 7, 8, 9, 5, 11, 12.
Найти коэффициенты ранговой корреляции Спирмена и Кендалла между "правильными" рангами и рангами , которые присвоены полосам испытуемым.
II. 357. Четыре преподавателя расположили 10 студентов по результатам текущей успеваемости по алгебре, аналитической геометрии, общей физике и истории отечества:
Ранг | успев. по алгебре | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 |
Ранг | успев. по анал. геом. | 1 | 2 | 4 | 3 | 6 | 7 | 5 | 10 | 8 | 9 |
Ранг | успев. по физике | 3 | 5 | 1 | 4 | 2 | 9 | 7 | 6 | 10 | 8 |
Ранг | успев. по истории | 8 | 6 | 10 | 1 | 9 | 2 | 4 | 3 | 5 | 8 |
Найдите матрицу ранговой корреляции Кенделла и два предмета, оценки по которым наиболее согласуются.
358. Докажите, что если между качественными признаками А и В имеется "полная прямая зависимость" ("противоположная зависимость"), то выборочные коэффициенты ранговой корреляции Спирмена и Кендалла равны единице (минус единице).
III. 359. Найдите корреляционную матрицу для характеристики директорского и учительского корпуса Ярославской области по стажу педагогической работы.
всего | До 2 лет | 2-5 лет | 5-10 лет | 10-20 лет | свыше 20 лет | пенсионеры | |||||||
Кол-во | % | Кол-во | % | Кол-во | % | Кол-во | % | Кол-во | % | Кол-во | % | ||
Дир. СШ | 289 | 6 | 2,1 | 7 | 2,4 | 21 | 7,3 | 59 | 20,4 | 198 | 67,8 | 63 | 21,8 |
Зам. дир.
СШ |
687 | 28 | 4,1 | 28 | 4,0 | 67 | 9,8 | 241 | 35,1 | 323 | 47,0 | 63 | 9,2 |
Учит.
гуманит. и ест.-мат циклов |
6343 | 462 | 7,3 | 411 | 6,5 | 843 | 13,3 | 2039 | 32,1 | 2588 | 40,8 | 766 | 12.1 |
Учит.др. спец. | 1984 | 135 | 6,8 | 119 | 6,0 | 299 | 15,0 | 684 | 34,5 | 747 | 37,7 | 141 | 7,1 |
360. Найдите корреляционные матрицы по производству продуктов животноводства (в тыс. тонн и в % к 2001 году) в хозяйствах 10 регионов РФ в 2002 году.
Области | Скот и птица | Молоко | Яйца | ||||||
Тыс. тонн | В % к 2001 г. | рост | Тыс. тонн | В % к 2001 г. | рост | Тыс. тонн | В % к 2001 г. | рост | |
Орловская | 56,7 | 108,6 | 279,6 | 98,9 | 202 | 92 | |||
Московская | 103,4 | 106,4 | 778,5 | 97,8 | 1238 | 88 | |||
Ярославская | 32,5 | 105,5 | 291 | 99,6 | 384 | 105,8 | |||
Владимирская | 42,7 | 105,3 | 283 | 100,3 | 333 | 107,3 | |||
Калужская | 40,5 | 103,3 | 238 | 93,8 | 171 | 124 | |||
Тульская | 51,0 | 102,8 | 282 | 99,8 | 401 | 100,6 | |||
Рязанская | 41,7 | 100,3 | 380 | 102,5 | 332 | 98,3 | |||
Тверская | 45,9 | 99,7 | 373 | 99,4 | 385 | 102 | |||
Ивановская | 27,6 | 99,6 | 194 | 97,7 | 204 | 103,7 | |||
Костромская | 30,4 | 97,5 | 195 | 101 | 365 | 112,1 |
Какая из полученных корреляционных матриц лучше отражает связь при производстве продуктов животноводства в регионах РФ?