На разных этапах статистического исследования возникает необходимость в формулировании и экспериментальной проверке некоторых предположительных утверждений (гипотез). Статистической называют гипотезу о виде неизвестного распределения или о параметрах известных распределений. Выдвигается основная (нулевая) гипотеза и проверяется, не противоречит ли она имеющимся эмпирическим данным. Конкурирующей (альтернативной) называют гипотезу , которая противоречит нулевой.
В результате статистической проверки гипотезы могут быть допущены ошибки двух родов. Ошибка первого рода состоит в том, что будет отвергнута правильная гипотеза; вероятность совершить такую ошибку обозначают и называют ее уровнем значимости. Ошибка второго рода состоит в том, что будет принята неправильная гипотеза, вероятность которой обозначают , а мощностью критерия является вероятность .
Процедура обоснованного сопоставления высказанной гипотезы с имеющейся выборкой осуществляется с помощью того или иного статистического критерия и называется статистической проверкой гипотез. Под критической областью понимают совокупность значений критерия, при которых нулевую гипотезу отвергают. Критическую область при заданном уровне значимости следует строить так, чтобы мощность критерия была максимальной.
Статистические критерии проверки гипотез разнообразны, но у них единая логическая схема построения, которую представим на рис. 103.
1. Сравнение двух дисперсий нормальных генеральных совокупностей.
При заданном уровне значимости проверяется нулевая гипотеза, состоящая в
том, что генеральные дисперсии рассматриваемых совокупностей равны между
собой:
Пример 181. Исследование длительности оборотных средств двух групп предприятий (по 13 предприятий в каждой) дало следующие результаты:
дня, дней, дня, дней.
Можно ли считать, что отклонения в длительности оборота оборотных средств групп предприятий одинаковы для уровня значимости 0,1?
Решение. В этой задаче надо проверить нулевую гипотезу о равенстве генеральных дисперсий нормальных совокупностей при конкурирующей гипотезе . Используем критерий Фишера-Снедекора со степенями свободы и вычислим наблюдаемое значение критерия (отношение большей дисперсии к меньшей)
По таблице приложения 6 по уровню значимости для двусторонней критической области и числам степеней свободы находим критическую точку
Так как , то нет оснований отвергать нулевую гипотезу о равенстве отклонений в длительности оборота оборотных средств двух групп предприятий.
Пример 182. Школьникам давались обычные арифметические задачи, а потом одной случайно выбранной половине учащихся сообщалось, что они не выдержали испытания, а остальным - обратное. Затем у каждого из них спрашивали, сколько секунд ему потребуется для решения новой задачи. Экспериментатор, вычисляя разность между определенным временем решения задачи, которое называл школьник, и результатами ранее выполненного задания, получил следующие данные:
группа 1 (учащиеся, которым сообщалось о положительном результате) | |
группа 2 (учащиеся, которым сообщалось о неудаче) |
Проверьте на уровне значимости 0,01 гипотезу о том, что дисперсия совокупности детских оценок, имеющих отношение к оценке их возможностей, не зависит от того, что сообщалось детям о плохих результатах испытаний или об удачном решении первой задачи.
Решение. Применим критерий Фишера-Снедекора для нулевой гипотезы и конкурирующей . Вычислим наблюдаемое значение критерия
Критическую точку находим в приложении для уровня значимости и числам степеней свободы и :
Получили, что и нулевая гипотеза на уровне значимости 0,01 отвергается.
2. Сравнение двух средних нормальных генеральных совокупностей с известными дисперсиями. Проверяется нулевая гипотеза о равенстве генеральных средних рассматриваемых совокупностей с заданными или вычисляемыми дисперсиями. В качестве критерия проверки нулевой гипотезы примем случайную величину
Пример 183. Производительность двух моторных заводов, выпускающих дизельные двигатели, характеризуется следующими данными:
1-й завод | 72 | 84 | 69 | 74 | 82 | 67 | 75 | 86 | 68 | 61 |
2-й завод | 55 | 65 | 73 | 66 | 58 | 71 | 77 | 68 | 68 | 59 |
Можно ли считать одинаковыми производительности дизельных двигателей на обоих заводах при уровне значимости ?
Решение. Найдем выборочные числовые характеристики данных независимых выборок:
Найдем наблюдаемое значение критерия:
По условию, конкурирующая гипотеза имеет вид , поэтому критическая область - двусторонняя.
Найдем критическую точку:
по таблице функции Лапласа (прил. 2) находим .
Так как , то нулевая гипотеза об одинаковости производительности двух заводов отклоняется.
3. Сравнение выборочной средней с гипотетической генеральной средней нормальной совокупности. По выборочной средней при заданном уровне значимости проверяется нулевая гипотеза о равенстве генеральной средней гипотетическому значению . В качестве проверки нулевой гипотезы примем случайную величину
которая распределена нормально.
Пример 184. Из нормальной генеральной совокупности с известным средним квадратическим отклонением извлечена выборка объема и по ней найдена выборочная средняя . Проверить нулевую гипотезу , при конкурирующей гипотезе и уровне значимости 0,1.
Решение. Найдем наблюдаемое значение критерия:
Найдем критическую точку двусторонней критической области:
и по таблице функции Лапласа находим .
Поскольку , то нулевая гипотеза принимается.
4. Сравнение наблюдаемой относительной частоты с гипотетической вероятностью появления события. При заданном уровне значимости проверяется нулевая гипотеза, состоящая в том, что неизвестная вероятность появления события равна гипотетической вероятности серии повторных независимых испытаний.
В качестве критерия проверки нулевой гипотезы принимаем случайную величину
Пример 185. По 100 независимым испытаниям найдена относительная частота 0,07. При уровне значимости 0,05 проверить нулевую гипотезу при конкурирующей гипотезе .
Решение. Найдем наблюдаемое значение критерия:
Учитывая, что критическая область двусторонняя, находим из равенства
По таблице функции Лапласа (прил. 2) находим .
Поскольку , то нет оснований отвергать гипотезу о незначительном отличии наблюдаемой относительной частоты от гипотетической вероятности.
Вопросы для самоконтроля
Задачи
I 361. По двум независимым выборкам, объемы которых и , извлеченным из нормальных генеральных совокупностей и , найдены исправленные выборочные дисперсии и . При уровне значимости проверьте нулевую гипотезу о равенстве генеральных дисперсий, при конкурирующей гипотезе .
362. По двум независимым выборкам, объем которых и , извлеченным из нормальных генеральных совокупностей и , найдены выборочные дисперсии и . При уровне значимости проверьте нулевую гипотезу о равенстве генеральных дисперсий при конкурирующей гипотезе .
363. Проведено исследование розничного товарооборота продовольственных магазинов в двух районах Ярославской области (по 20 магазинов в каждом). Априори известны средние значения розничного товарооборота - 78,8 и 78,56 тыс. руб. Полученные в результате оценки средних квадратичных отклонений в первом и втором районах соответственно равны 7,2 и 7,8 тыс. руб. Можно ли считать, что разброс розничного товарооборота магазинов в районах неодинаков при уровне значимости ? Можно ли сделать вывод о разной покупательной способности населения районов?
364. По выборке объема найден средний вес г. изделий, изготовленных на первом станке; по выборке объема найден средний вес г. изделий, изготовленных на втором станке. Генеральные дисперсии известны: . Проверьте нулевую гипотезу при конкурирующей гипотезе и уровне значимости 0,05. Предполагаем, что случайные величины и распределены нормально и выборки независимы.
365. Исследование пропусков по болезни детей в двух группах детского сада в течение года (по 16 детей в каждой группе) дало следующие результаты: дня, день, , .
Можно ли считать, что среднее количество дней пропусков по болезни в обеих группах одинаково при уровне значимости ?
366. Из нормальной генеральной совокупности с известным средним квадратическим отклонением известна выборка объема , и по ней найдена выборочная средняя . Проверьте нулевую гипотезу при конкурирующей гипотезе и уровне значимости 0,01.
II 367. Из двух партий изделий, изготовленных на двух одинаково настроенных станках, известны малые выборки, объемы которых и . Получены следующие результаты:
Контролируемый размер
изделий первого станка |
3,4 | 3,5 | 3,8 | 3,9 |
Число изделий | 2 | 4 | 5 | 1 |
Контролируемый размер
изделий второго станка |
3,2 | 3,4 | 3,7 | |
Число изделий | 4 | 3 | 8 |
Проверьте нулевую гипотезу о равенстве средних размеров изделий при уровне значимости 0,05.
368. По 100 независимым испытаниям найдена относительная частота . При уровне значимости 0,05 проверьте нулевую гипотезу при конкурирующей гипотезе а) ; б) .
III 369. В банке в течение двух дней проводилось исследование времени обслуживания клиентов, данные которого представлены в таблице:
Номер
интервала |
Время обслуживания (мин.) | Число клиентов в
1-й день |
Число клиентов во 2-й день |
1
2 3 4 5 6 7 |
6-8
8-10 10-12 12-14 14-16 16-18 18-20 |
2
3 8 12 15 10 3 |
3
4 9 13 17 8 3 |
Можно ли считать одинаковыми отклонения от среднего времени обслуживания клиентов банка в 1-й и 2-й дни при ?
370. За смену отказали 20 элементов первого устройства, состоящего из 800 элементов, и 30 элементов второго, состоящего из 1000 элементов. При уровне значимости проверьте нулевую гипотезу о равенстве вероятностей отказа элементов обоих устройств при конкурирующей гипотезе .