Автор работы: Пользователь скрыл имя, 08 Мая 2012 в 00:42, доклад
Изучение вариации в статистике. Показатели вариации: размах вариации, среднее линейное отклонение, дисперсия (s2), среднее квадратическое отклонение (s), коэффициент вариации (v). Методы расчета дисперсии. Общая дисперсия, частная (групповая) дисперсия, средняя из групповых дисперсий, межгрупповая дисперсия.
ТЕМА 6. ПОКАЗАТЕЛИ ВАРИАЦИИ
Изучение вариации в статистике. Показатели вариации: размах вариации, среднее линейное отклонение, дисперсия (s2), среднее квадратическое отклонение (s), коэффициент вариации (v). Методы расчета дисперсии. Общая дисперсия, частная (групповая) дисперсия, средняя из групповых дисперсий, межгрупповая дисперсия. Теорема сложения дисперсий. Коэффициент детерминации (h2) и эмпирическое корреляционное отношение (h). Дисперсия альтернативно варьирующегося (качественного) признака.
Методические указания
Колеблемость, многообразие, изменяемость величины признака у единиц совокупности называются вариацией.
Показатели вариации делятся на две группы: абсолютные и относительные. К абсолютным относятся размах вариации, среднее линейное отклонение, дисперсия и среднее квадратическое отклонение. Вторая группа показателей вычисляется как отношение абсолютных показателей вариации к средней арифметической (или медиане). Относительными показателями вариации являются коэффициенты осцилляции, вариации, относительное линейное отклонение и др.
Размах вариации (R) — это разность между наибольшим (Xmax) и наименьшим (Xmin) значениями варьирующего признака: R = Xmax – Xmin
Среднее линейное отклонение (`d) — вычисляется как средняя арифметическая из абсолютных значений отклонений вариант xi от`x:
(простая);
Дисперсия (s2) представляет собой средний квадрат отклонений индивидуальных значений признака от их средней величины и вычисляется по формулам простой и взвешенной дисперсий (в зависимости от исходных данных):
(простая); (взвешенная)
эта формула более удобна для практических расчетов.
Среднее квадратическое (стандартное отклонение) отклонение:
Исчисление среднего квадратического отклонения для явно несимметричных распределений не имеет смысла. Совокупность считается однородной, если коэффициент вариации не превышает 33 % (для распределений, близких к нормальному).
Коэффициент вариации (Vs):
Дисперсия альтернативного признака равна произведению доли (р) на дополняющее эту долю до единицы число (q): . Предельное значение дисперсии альтернативного признака равно 0,25 при р = 0,5.
Общая дисперсия s2 измеряет вариацию признака во всей совокупности под влиянием всех факторов, обусловивших эту вариацию:
Межгрупповая дисперсия d2x характеризует систематическую вариацию, т. е. различия в величине изучаемого признака, возникающие под влиянием признака-фактора, положенного в основание группировки. Она рассчитывается по формуле
,
где `хi и ni — соответственно групповые средние и численности по отдельным группам.
Внутригрупповая дисперсия
() отражает случайную вариацию, т. е. часть
вариации, происходящую под влиянием неучтенных
факторов и не зависящую от признака-фактора,
положенного в основание группировки.
Она исчисляется следующим образом:
Средняя из внутригрупповых дисперсий (`s2i):
Существует закон, связывающий три вида дисперсии. Общая дисперсия равна сумме средней из внутригрупповых и межгрупповой дисперсией: s2 =`s2i + d2x.
В статистическом анализе широко используется показатель, представляющий собой долю межгрупповой дисперсии в общей дисперсии. Он носит название эмпирического коэффициента детерминации (): .
Этот коэффициент показывает долю (удельный вес) общей вариации изучаемого признака обусловленную вариацией группировочного признака.
Корень квадратный из эмпирического коэффициента детерминации носит название эмпирического корреляционного отношения (h): .
Оно характеризует влияние признака, положенного в основание группировки, на вариацию результативного признака. Эмпирическое корреляционное отношение изменяется в пределах от 0 до 1. Если h = 0, то группировочный признак не оказывает влияние на результативный. Если h = 1, то результативный признак изменяется только в зависимости от признака, положенного в основание группировки, а влияние прочих факторных признаков равно нулю. Промежуточные значения оцениваются в зависимости от их близости к предельным значениям.
Показатели вариации
Вариацию можно определить как количественное различие значений одного и того же признака у отдельных единиц совокупности. Термин «вариация» имеет латинское происхождение - variatio, что означает различие, изменение, колеблемость. Изучение вариации в статистической практике позволяет установить зависимость между изменением, которое происходит в исследуемом признаке, и теми факторами, которые вызывают данное изменение.
Для измерения вариации признака используют как абсолютные, так и относительные показатели.
К абсолютным показателям вариации относят: размах вариации, среднее линейное отклонение, среднее квадратическое отклонение, дисперсию.
К относительным показателям вариации относят: коэффициент осцилляции, линейный коэффициент вариации, относительное линейное отклонение и др.
Размах вариации R. Это самый доступный по простоте расчета абсолютный показатель, который определяется как разность между самым большим и самым малым значениями признака у единиц данной совокупности:
(6.1)
Размах вариации (размах колебаний) - важный показатель колеблемости признака, но он дает возможность увидеть только крайние отклонения, что ограничивает область его применения. Для более точной характеристики вариации признака на основе учета его колеблемости используются другие показатели.
Среднее линейное отклонение d, которое вычисляют для того, чтобы учесть различия всех единиц исследуемой совокупности. Эта величина определяется как средняя арифметическая из абсолютных значений отклонений от средней. Так как сумма отклонений значений признака от средней величины равна нулю, то все отклонения берутся по модулю.
Формула среднего линейного отклонения (простая)
(6.2)
Формула среднего линейного отклонения (взвешенная)
(6.3)
При использовании показателя среднего линейного отклонения возникают определенные неудобства, связанные с тем, что приходится иметь дело не только с положительными, но и с отрицательными величинами, что побудило искать другие способы оценки вариации, чтобы иметь дело только с положительными величинами. Таким способом стало возведение всех отклонений во вторую степень. Обобщающие показатели, найденные с использованием вторых степеней отклонений, получили очень широкое распространение. К таким показателям относятся среднее квадратическое отклонение и среднее квадратическое отклонение в квадрате , которое называют дисперсией.
Средняя квадратическая простая
(6.4)
Средняя квадратическая взвешенная
(6.5)
Дисперсия есть не что иное, как средний квадрат отклонений индивидуальных значений признака от его средней величины.
Формулы дисперсии взвешенной и простой :
(6.6)
Расчет дисперсии можно упростить. Для этого используется способ отсчета от условного нуля (способ моментов), если имеют место равные интервалы в вариационном ряду.
Кроме показателей вариации, выраженных в абсолютных величинах, в статистическом исследовании используются показатели вариации (V), выраженные в относительных величинах, особенно для целей сравнения колеблемости различных признаков одной и той же совокупности или для сравнения колеблемости одного и того же признака в нескольких совокупностях.
Данные показатели рассчитываются как отношение размаха вариации к средней величине признака (коэффициент осцилляции), отношение среднего линейного отклонения к средней величине признака (линейный коэффициент вариации), отношение среднего квадратического отклонения к средней величине признака (коэффициент вариации) и, как правило, выражаются в процентах.
Формулы расчета относительных показателей вариации:
(6.7)
где VR - коэффициент осцилляции; - линейный коэффициент вариации; - коэффициент вариации.
Из приведенных формул видно, что чем больше коэффициент V приближен к нулю, тем меньше вариация значений признака.
В статистической практике наиболее часто применяется коэффициент вариации. Он используется не только для сравнительной оценки вариации, но и для характеристики однородности совокупности. Совокупность считается однородной, если коэффициент вариации не превышает 33% (для распределений, близких к нормальному).
Показатели вариации
Вариация - это различие значений величин X у отдельных единиц статистической совокупности. Для изучения силы вариации рассчитывают следующие показатели вариации: размах вариации, среднее линейное отклонение, линейный коэффициент вариации, дисперсия, среднее квадратическое отклонение, квадратический коэффициент вариации.
Размах вариации
Размах вариации – это разность между максимальным и минимальным значениями X из имеющихся в изучаемой статистической совокупности:
Недостатком показателя H является то, что он показывает только максимальное различие значений X и не может измерять силу вариации во всей совокупности.
Cреднее линейное отклонение
Cреднее линейное отклонение - это средний модуль отклонений значений X от среднего арифметического значения. Его можно рассчитывать по формуле средней арифметической простой - получим среднее линейное отклонение простое:
Например, студент сдал 4 экзамена и получил следующие оценки: 3, 4, 4 и 5. Ранее уже была рассчитана средняя арифметическая = 4. Рассчитаем среднее линейное отклонение простое: Л = (|3-4|+|4-4|+|4-4|+|5-4|)/4 = 0,5.
Если исходные данные X сгруппированы (имеются частоты f), то расчет среднего линейного отклонения выполняется по формуле средней арифметической взвешенной - получим среднее линейное отклонение взвешенное:
Вернемся к примеру про студента, который сдал 4 экзамена и получил следующие оценки: 3, 4, 4 и 5. Ранее уже была рассчитана средняя арифметическая = 4 и среднее линейное отклонение простое = 0,5. Рассчитаем среднее линейное отклонение взвешенное: Л = (|3-4|*1+|4-4|*2+|5-4|*1)/4 = 0,5.
Линейный коэффицинт вариации
Линейный коэффицинт вариации - это отношение среднего линейного отклонение к средней арифместической:
С помощью линейного коэффицинта вариации можно сравнивать вариацию разных совокупностей, потому что в отличие от среднего линейного отклонения его значение не зависит от единиц измерения X.
В рассматриваемом примере про студента, который сдал 4 экзамена и получил следующие оценки: 3, 4, 4 и 5, линейный коэффициент вариации составит 0,5/4 = 0,125 или 12,5%.
Дисперсия
Дисперсия - это средний квадрат отклонений значений X от среднего арифместического значения. Дисперсию можно рассчитывать по формуле средней арифметической простой - получим дисперсию простую:
В уже знакомом нам примере
про студента, который сдал 4 экзамена
и получил оценки: 3, 4, 4 и 5, ранее
уже была рассчитана средняя арифметическая
= 4. Тогда дисперсия простая Д = ((3-4)2+(4-4)2+(4-4)2+(5-4)2)/
Если исходные данные X сгруппированы (имеются частоты f), то расчет дисперсии выполняется по формуле средней арифметической взвешенной - получим дисперисю взвешенную:
В рассматриваемом примере про студента, который сдал 4 экзамена и получил следующие оценки: 3, 4, 4 и 5, рассчитаем дисперсию взвешенную: Д = ((3-4)2*1+(4-4)2*2+(5-4)2*1)/4 = 0,5.
Если преобразовать формулу дисперсии (раскрыть скобки в числителе, почленно разделить на знаменатель и привести подобные), то можно получить еще одну формулу для ее расчета как разность средней квадратов и квадрата средней:
В уже знакомом нам примере про студента, который сдал 4 экзамена и получил следующие оценки: 3, 4, 4 и 5, рассчитаем дисперсию методом разности средней квадратов и квадрата средней:
Д = (32*1+42*2+52*1)/4-42 = 16,5-16 = 0,5.
Если значения X - это доли совокупности, то для расчета дисперсии используют частную формулу дисперсии доли:
.
Cреднее квадратическое отклонение
Выше уже было рассказано
о формуле средней
Еще проще можно найти среднее квадратическое отклонение, если предварительно рассчитана дисперсия, как корень квадратный из нее:
В примере про студента, в котором выше рассчитали дисперсию, найдем среднее квадратическое отклонение как корень квадратный из нее: .
Квадратический коэффициент вариации
Квадратический коэффициент вариации - это самый популярный относительный показатель вариации:
Критериальным значением квадратического коэффициента вариации V служит 0,333 или 33,3%, то есть если V меньше или равен 0,333 - вариация считает слабой, а если больше 0,333 - сильной. В случае сильной вариации изучаемая статистическая совокупность считается неоднородной, а средняя величина - нетипичной и ее нельзя использовать как обобщающий показатель этой совокупности.