Далее: §34. Доверительный интервал Вверх: Глава V. Математическая статистика Назад: §32. Вариационный и статистический

§33. Выборочные характеристики вариационного ряда

Пусть выборка задана вариационным рядом

$x_{i}$ $x_{1}$ $x_{2}$ . . . $x_{k}$ , где $\sum\limits_{i = 1}^k {m_i } = n.$
$m_{i}$ $m_{1}$ $m_{2}$ . . . $m_{k}$  

Выборочным средним называется величина $x^\ast =
{\displaystyle 1\over\displaystyle n}\sum\limits_{i = 1}^k {x_i m_i } .$

Выборочная дисперсия $D^\ast [X] = {\displaystyle 1\over\displaystyle n}\sum\limits_{i = 1}^k
{(x_i - x^\ast )^2 \cdot m_i } ,$ а корень квадратный из выборочной дисперсии называется выборочным средним квадратическим отклонением $\sigma ^\ast [X] = \sqrt {D^\ast [X]} .$

Выборочные начальные и центральные моменты порядка $s$ определяются соответственно формулами:


\begin{displaymath}
\alpha _s^\ast = {\displaystyle 1\over\displaystyle n}\sum\l...
...style n}\sum\limits_{i = 1}^k {(x_i - x^\ast )^s \cdot m_i
} .
\end{displaymath}

Модой $(M_{o})$ называется вариант, наиболее часто встречающийся в данном вариационном ряду.

Медианой $(M_{е})$ называется вариант $x_{l}$ такой, что $\sum\limits_{i = 1}^l {m_i } \ge {\displaystyle n\over\displaystyle 2}$ и $\sum\limits_{i = l}^k {m_i
} \ge {\displaystyle n\over\displaystyle 2}.$ Медиана обладает тем свойством, что сумма абсолютных величин отклонений вариантов от медианы меньше, чем от любой другой величины (в том числе и от выборочной средней).

Важность эмпирических характеристик заключается в том, что они близки (при достаточно большом $n$) к соответствующим теоретическим значениям. Поскольку выборочные характеристики являются случайными величинами, а теоретические - числа, то близость понимается в смысле сходимости по вероятностям.

Пример 161. Известно распределение золотых медалистов, окончивших в 2001 году школы Ярославской области, по районам:

Кол-во золотых медалистов 0 1 3 4 6 8 20
Кол-во районов 6 1 4 2 1 3 1

Дайте характеристику распределения признака (число золотых медалистов по районам), вычислив для этого:

а) выборочную среднюю, б) моду и медиану, в) показатели вариации (дисперсию, среднее квадратическое отклонение, размах варьирования).

Решение. а) $х^\ast = {\displaystyle 1\over\displaystyle 18}(0 \cdot 6 + 1 \cdot 1 + 3 \cdot 4 + 4
\cdot 2 + 6 \cdot 1 + 8 \cdot 3 + 20 \cdot 1) \approx 4;$

б) $M_{\rm о} = 0$, т.к. $6 = \max \left\{ {6,1,4,2,3} \right\}$.

$M_{{\rm е}} = 3$, т.к. $6 + 1 + 4 = 11 \ge {\displaystyle 18\over\displaystyle 2}$ и $4 + 2 + 1 + 3 +
1 = 11 \ge {\displaystyle 18\over\displaystyle 2};$

в) $D^\ast [X] = {\displaystyle 1\over\displaystyle 18}(16 \cdot 6 + 9 \cdot 1 + 1 \cdot 4 + 4 \cdot 1
+ 16 \cdot 3 + 256 \cdot 1) \approx 23,2;$


\begin{displaymath}
\sigma ^\ast [X] = + \sqrt {23,2} \approx 4,8;
\end{displaymath}

$R = 20 - 0 = 20$.

Пример 162. Измерение роста (в см) 100 студентов-первокурсников университета дало следующие результаты:

Рост 154-158 158-162 162-166 166-170 170-174 174-178 178-182
Число студ-ов 10 14 26 28 12 8 2

Найдите выборочную среднюю и выборочное среднее квадратическое отклонение роста первокурсников.

Решение. В качестве вариант $x_{i}$ примем середины интервалов и найдем выборочную среднюю роста студентов.

$х^\ast = 0,01 \cdot (156 \cdot 10 + 160 \cdot 14 + 164 \cdot 26 + 168 \cdot
28 + 172 \cdot 12 + 176 \cdot 8 + 180 \cdot 2) = 166$(см). Вычислим теперь выборочную дисперсию


\begin{displaymath}
D^\ast = 0,01 \cdot \left[ {( - 10)^2 \cdot 10 + ( - 6)^2 \c...
... + 6^2 \cdot 12 + 10^2 \cdot 8 + 14^2 \cdot 2}
\right] = 33,44
\end{displaymath}

и, извлекая из полученного числа корень квадратный, находим среднее квадратическое отклонение

$\sigma ^\ast [X] = \sqrt {D^\ast [X]} = \sqrt {33,44} \approx 5,78$(см).

Допустим, что все значения количественного признака $Х$ разбиты на $k$ групп. Рассматривая каждую группу как самостоятельную совокупность, можно найти групповые средние и дисперсии. Внутригрупповой дисперсией называют среднюю арифметическую дисперсий, взвешенную по объемам групп:

$D_{внгр} = {\left({\sum {N_j \cdot D_{j{ гр}} } } \right)}
\mathord{\left/ {\vp...
...ot D_{j{ гр}} } }
\right)} n}} \right. \kern-\nulldelimiterspace} n\quad (N_{j}$ - объем группы $j$, $n = \sum {N_j } )$.

Межгрупповой дисперсией называют дисперсию групповых средних относительно общей средней:

$D_{{межгр}} = {\left( {\sum {N_j \cdot (\bar {х}_j - \bar {х})^2} }
\right)} \m...
...-\nulldelimiterspace} n(\bar
{х},\bar {х}_j -\mbox{ общая и групповые средние})$.

Пример 163. Найти групповые, внутригрупповую, межгрупповую и общую дисперсии совокупности, состоящей из следующих двух групп:

Первая группа   Вторая группа
$x_{i}$ 2 4 7   $x_{i}$ 3 5 6 10
$m_{i}$ 3 5 2   $m_{i}$ 4 4 3 4
$N_{1}$ = 10   $N_{2}$ = 15

Решение. 1). Найдем общую и групповые средние:


\begin{displaymath}
х^\ast = {\displaystyle 1\over\displaystyle 25} \cdot (2 \cd...
...dot 2 + 3 \cdot 4 +
5 \cdot 4 + 6 \cdot 3 + 10 \cdot 4) = 4,8;
\end{displaymath}


\begin{displaymath}
х_1^\ast = {\displaystyle 1\over\displaystyle 10} \cdot (2 \...
...5} \cdot (3 \cdot 4 + 5 \cdot 4 + 6 \cdot 3 + 10 \cdot
4) = 6,
\end{displaymath}

и, используя их, - групповые дисперсии:


\begin{displaymath}
D_{1{\rm гр}} = {\displaystyle 1\over\displaystyle 10} \cdot...
... \cdot 3 + (4 - 4)^2
\cdot 5 + (7 - 4)^2 \cdot 2} \right) = 3;
\end{displaymath}


\begin{displaymath}
D_{2{\rm гр}} = {\displaystyle 1\over\displaystyle 15} \cdot...
... \cdot 4)} \right) =
{\displaystyle 154\over\displaystyle 15}.
\end{displaymath}

2). Найдем внутригрупповую и межгрупповую дисперсии


\begin{displaymath}
D_{{\rm внгр}} = {\displaystyle 1\over\displaystyle 25} \cdo...
... {10 \cdot (3 - 4,8)^2 + 15 \cdot
(6 - 4,8)^2} \right) = 2,16.
\end{displaymath}

3). Найдем общую дисперсию


\begin{displaymath}
\begin{array}{l}
D_{{\rm общ}} = {\displaystyle 1\over\disp...
...t) = 9,52 = D_{{\rm внгр}} + D_{{\rm межгр}} . \\
\end{array}\end{displaymath}

Для вычисления выборочных характеристик при больших выборках используют метод произведений, который продемонстрируем на следующем примере.

Пример 164. Найти выборочные среднюю и дисперсию следующего статистического распределения:

$x_{i}$ 20,0 20,2 20,4 20,6 20,8 21,0 21,2 21,4 21,6 21,8 22,0
$m_{i}$ 2 3 7 11 17 20 16 13 6 4 1

Решение. Составим расчетную таблицу, для чего

  1. запишем варианты в первый столбец;
  2. запишем частоты во второй столбец, сумму частот (100) поместим в нижнюю клетку столбца;
  3. в качестве ложного нуля выберем варианту 21,0 (в середине ряда) и записываем условные варианты $u_{i} = (x_{i} - 21)) / 0,2 $;
  4. произведения частот на условные варианты записываем в четвертый столбец; отдельно находим сумму отрицательных $( - 82)$ и отдельно сумму положительных (81) чисел, а их сумму $(- 1)$ помещаем в нижнюю клетку столбца;
  5. произведения частот на квадраты условных вариант записываем в пятый столбец, а их сумму (433) помещаем в нижнюю клетку столбца;
  6. произведения частот на квадраты условных вариант, увеличенных на единицу, запишем в шестой контрольный столбец, а их сумму помещаем в нижнюю клетку столбца.

Контроль: $\sum {m_i \cdot u_i ^2} + 2\sum {m_i \cdot u_i + n = 433 + 2
\cdot ( - 1) + 100 = 531 = \sum {m_i \cdot (u_i + 1)^2} } $, и вычисления произведены правильно.

1 2 3 4 5 6
$x_{i}$ $m_{i}$ $u_{i}$ $m_{i}\cdot u_{i}$ $m_{i}\cdot u_{i}^{2}$ $m_{i}\cdot $ ($u_{i}$+1)$^{2}$
20,0 2 -5 -10 50 32
20,2 3 -4 -12 48 27
20,4 7 -3 -21 63 28
20,6 11 -2 -22 44 11
20,8 17 -1 -17 17 0
21,0 20 0 $A_{1} = -82$   20
21,2 160 1 16 16 64
21,4 13 2 26 52 117
21,6 6 3 18 54 96
21,8 4 4 16 64 100
22,0 1 5 5 25 36
  100   $A_{2} = 81$    
      $\Sigma m_{i}\cdot u_{i} = -1$ $\Sigma m_{i}\cdot u_{i}^{2}= 433$ $\Sigma m_{i}\cdot (u_{i}+1)^{2}= 531$

Вычислим теперь условные моменты первого и второго порядков:


\begin{displaymath}
\begin{array}{l}
М_1 ^\ast = {\left( {\sum {m_i u_i } } \ri...
...ight. \kern-\nulldelimiterspace} {100} = 4,33. \\
\end{array}\end{displaymath}

Найдем искомые выборочные среднюю и дисперсию:


\begin{displaymath}
\begin{array}{l}
x^\ast = M_1 ^\ast \cdot h + C = ( - 0,01)...
... - 0,01)^2} \right] \cdot 0,2^2 \approx 0,173. \\
\end{array}\end{displaymath}

Если первоначальные варианты не являются равноотстоящими, то интервал, в котором заключены все варианты выборки, делят на несколько равных частичных интервалов.

Пример 165. Найти выборочную среднюю и выборочную дисперсию для следующего вариационного ряда:

$x_{i}$ 1 1,03 1,05 1,06 1,08 1,10 1,12 1,13 1,16 1,19 1,20 1,21 1,25 1,26 1,28
$m_{i}$ 1 3 6 4 2 4 3 6 5 2 4 4 8 4 4

1,30 1,32 1,35 1,37 1,38 1,39 1,40 1,44 1,46 1,47 1,49 1,50          
6 4 6 5 1 2 2 3 3 4 3 2          

Решение. Выделим пять частичных интервалов:

$1 - 1,0$ $m_{1} = 1 + 3 + 6 + 4 + 2 + 4:2 = 18$,
$1,1 - 1,2$ $m_{2} = 4:2 + 3 + 6 + 5 + 2 + 4:2 = 20$,
$1,2 - 1,3$ $m_{3} = 4:2 + 4 + 8 + 4 + 4 + 6:2 = 25$,
$1,3 - 1,4$ $m_{4} = 6:2 + 4 + 6 + 5 + 1 + 2 + 2:2 = 22$,
$1,4 - 1,5$ $m_{5} = 2:2 + 3 + 3 + 4 + 3 + 2:2 = 15$.

Составим новый вариационный ряд из середин выбранных частичных интервалов:

$y_{i}$ 1,05 1,15 1,25 1,35 1,45
$m_{i}$ 18 20 25 22 15

$ y^\ast = 1,246, \quad D_у ^\ast = 0,017 $ и сравнивая с $\bar {х}^\ast = 1,25, \quad D_х ^\ast = 0,018$, замечаем, что $у^\ast \approx х^\ast ,{\rm а}
\quad D_у ^\ast \approx D_x ^\ast$ , а вычмслений значительно меньше.

Вопросы для самоконтроля

  1. Какие выборочные числовые характеристики вариационного ряда вам известны?
  2. Существует ли зависимость между внутригрупповой, межгрупповой и общей дисперсией?
  3. Почему делается акцент на несмещенные оценки?
  4. Какие свойства отклонения от общей средней вы знаете?
  5. Как вводятся условные варианты?
  6. В чем смысл метода произведения?
  7. На каких свойствах математического ожидания и дисперсии основан метод произведения?
  8. Как свести первоначальные варианты к равноотстоящим?

Задачи

I. 321. $\alpha $ - частицы, достигающие счетчика в некотором опыте, образуют следующую выборку:

$x_{i}$ 0 1 2 3 4 5 6 7 8 9 10
$m_{i}$ 21 81 156 200 195 152 97 54 26 11 7

Найдите выборочную среднюю, моду и медиану для числа $\alpha $ - частиц, достигающих счетчика.

322. Распределение рабочих цеха по проценту выполнения норм выработки выглядит следующим образом:

% выполнения норм 50 - 70 70 - 90 90 - 110 110 - 130 130 - 150 150 - 170
Число рабочих 20 25 35 30 20 10

Найдите средний процент выполнения норм выработки рабочими цеха.

323. Для определения "общего интеллекта" школьникам предлагалось раскрыть геометрические закономерности. Оценка осуществлялась по количеству правильно решенных задач и дала следующие результаты:

Кол-во баллов 14 15 16 17 18 19 20
Кол-во школьников 4 11 15 16 19 15 5

Найдите моду и медиану данного вариационного ряда.

324. Дайте характеристику изменений показателей психологической защищенности младших подростков до и после эксперимента, в ходе которого получены следующие результаты:

Показатели

психологической защищенности

от публичного унижения от оскорблений от высмеиваний от угроз от обзываний от непр. отношений от игнорирования от недобрых отношений
до эксперимента 2,4 2,1 2,2 2,5 2,2 2,2 2,4 2,2
после эксперимента 2,6 2,2 2,4 2,8 2,3 2,6 2,8 2,4

325. Какой вывод можно сделать об эффективности интерактивного обучения по выраженности базовых ценностей и экологических ориентаций в экспериментальной и контрольной группах в конце обучения? Количества выборов представлены в таблице:

Наименование показателя Признание и уважение людей Природа как
среда сущ. любимых животных и растений
Природа как условие благополучия будущего поколения Природа как объект заботы
среднее по эксп. группе 6,64 2,24 4,4 3,92
среднее по контр. группе 4,95 3,53 3,53 2,88

326. Найдите внутригрупповую, межгрупповую и общую дисперсию выборки, состоящей из трех групп:

первая группа

$х_{i}$ 2 3 8
$m_{i}$ 30 20 10

вторая группа

$х_{i}$ 1 6
$m_{i}$ 10 20

третья группа

$х_{i}$ 3 5 7
$m_{i}$ 8 12 10

II. 327. Найдите методом произведений выборочную среднюю и выборочную дисперсию по заданному распределению выборки объема n = 100:

варианты 22 24 26 28 30 32
частота 5 15 50 18 10 4

328. Найдите методом произведений выборочные среднюю и дисперсию вариационного ряда:

$х_{i}$ 6,2 6,4 6,6 6,8 7,0 7,2 7,4 7,6 7,8 8,0
$m_{i}$ 2 3 8 13 25 20 12 10 6 1

III. 329. Вычислите выборочные средние и дисперсии по первоначальным и равностоящим вариантам (и сравните их) для вариационного ряда:

$х_{i}$ $m_{i}$ $х_{i}$ $m_{i}$ $х_{i}$ $m_{i}$
1,00

1,03

1,05

1,06

1,08

1,10

1

3

6

4

2

4

1,12

1,15

1,16

1,19

1,20

1,23

3

6

5

2

4

4

1,25

1,26

1,29

1,30

1,32

1,33

8

4

4

6

4

5

330.Найдите выборочную среднюю и выборочную дисперсию по первоначальным и равностоящим вариантам для следующего вариационного ряда:

$х_{i}$ 2 3 7 9 11 12,5 16 18,5 23 25 26
$m_{i}$ 3 5 10 6 10 4 12 13 8 20 9


Далее: §34. Доверительный интервал Вверх: Глава V. Математическая статистика Назад: §32. Вариационный и статистический

ЯГПУ, Центр информационных технологий обучения
2006-03-04