Статистическое изучение вариации массовых явлений

Автор работы: Пользователь скрыл имя, 07 Ноября 2011 в 18:18, курсовая работа

Краткое описание

При изучении социально-экономических явлений и процессов статистика встречается с разнообразной вариацией признаков, характеризующих отдельные единицы совокупности. Величины признаков колеблются, варьируют под действием различных причин и условий, которые в статистике называются факторами. Нередко эти факторы действуют в противоположном направлении и сами, в свою очередь, варьируют. Среди них есть существенные факторы, определяющие величину вариантов данного признака у всех единиц совокупности. Но есть и несущественные (чисто случайные), которые на одни единицы совокупности могут оказывать влияние, на другие нет. Вариация, порождаемая существенными факторами, носит систематический характер, т.е. наблюдается последовательное изменение вариантов признака в определенном направлении. Такая вариация называется систематической.

Содержимое работы - 1 файл

курсовая работа по теор. стат. (Восстановлен).docx

— 803.31 Кб (Скачать файл)

     Данные  рис. 1.1 показывают характерную для многих признаков форму распределения: чаще встречаются значения средних интервалов признака, реже - крайние; малые и большие значения признака. Форма этого распределения близка к рассматриваемому в курсе математической статистики закону нормального распределения. Великий русский математик А. М. Ляпунов (1857 - 1918) доказал, что нормальное распределение образуется, если на варьирующую переменную влияет большое число факторов, ни один из которых не имеет преобладающего влияния. Случайное сочетание множества примерно равных факторов, влияющих на вариацию урожайности зерновых культур, как природных, так и агротехнических, экономических, создает близкое к нормальному закону распределения распределение хозяйств области по урожайности.

     Если  имеется дискретный вариационный ряд  или используются середины интервалов, то графическое изображение такого вариационного ряда называется полигоном (от греч. слова - многоугольник).

Понятие частости

     Если  в табл. 1.1 число хозяйств с тем или иным уровнем урожайности выразить в процентах к итогу, принимая все число хозяйств (143) за 100%, то средняя урожайность может быть вычислена так:

где w - частость 7-й категории вариационного  ряда;

Кумулятивное  распределение

     Преобразованной формой вариационного ряда является ряд накопленных частот, приведенный в табл. 1.1. Это ряд значений числа единиц совокупности с меньшими и равными нижней границе соответствующего интервала значениями признака. Такой ряд называется кумулятивным. Можно построить кумулятивное распределение «не меньше, чем», а можно «больше, чем». В первом случае график кумулятивного распределения называется кумулятой, во втором - огивой (рис. 1.2).

Плотность, распределения

     Если  приходится иметь дело с вариационным рядом с неравными интервалами, то для сопоставимости нужно частоты  или частости привести к единице  интервала. Полученное отношение называется плотностью распределения:

     Плотность распределения используется как  для расчета обобщающих показателей, так и для графического изображения  вариационных рядов с неравными  интервалами. 
 
 
 
 
 
 
 
 
 

Рис. 1.2. Огива и кумулята распределения  по урожайности. 
 
 
 
 
 
 

ГЛАВА 2. Структурные средние величины (Мода и медиана).

Абсолютные  и относительные  показатели.

    Структурные средние величины.

   Средние являются обобщающими статистическими характеристиками изучаемого массового явления (совокупности) по тому или иному варьирующему признаку и одновременно своего рода абстракцией. Они отражают то общее, что присуще всем единицам совокупности.

   Поэтому наравне со средними в качестве общих  статистических характеристик изучаемого признака могут быть использованы величины конкретных вариантов, занимающих в  ранжированном (построенном в прядке возрастания или убывания) ряду индивидуальных значений признака определенное положение.

   В статистических исследованиях в  качестве вспомогательных описательных статистических характеристик распределения  варьирующего признака широко применяются  мода и медиана.

   Мода  – это наиболее часто встречающееся значение варьирующего признака в вариационном ряду.

     Модой распределения называется  такая величина изучаемого признака, которая в данной совокупности  встречается наиболее часто, т.е.  один из вариантов признака  повторяется чаще, чем все другие.

   Для дискретного ряда (ряд, в котором  значение варьирующего признака представлены отдельными числовыми показателями) модой является значение варьирующего признака обладающего наибольшей частотой.

     Для интервального ряда сначала  определяется модальный интервал (т.е. содержащий моду), в случае  интервального распределения с  равными интервалами определяется  по наибольшей частоте; с неравными  интервалами – по наибольшей  плотности, а определение моды  требует проведения расчетов  на основе следующих формул:

где:    - нижняя граница модального интервала;

    - величина  модального интервала;

      - частота  модального интервала;

  • - частота интервала, предшествующего модальному;
  • - частота интервала, следующего за модальным;

   Применяется мода при экспертных оценках, при  установлении размера изделий, который  пользуется наибольшим спросом (одежда, обувь), медиана используется при  статистическом контроле качества продукции.

   Медиана   - это значение варьирующего признака, приходящееся на середину ряда, расположенного в порядке возрастания или убывания числовых значений признака, т.е. величина изучаемого признака, которая находится в середине упорядоченного вариационного ряда. Главное свойство медианы в том, что сумма абсолютных отклонений значений признака от медианы меньше, чем от любой другой величины:

   Медиана соответствует варианту, стоящему в  середине ранжированного ряда. Положение  медианы определяется ее номером  , где n- число изучаемых единиц.

   Для определения медианы в дискретном ряду при наличии частот, сначала  исчисляется полусумма частот, а  затем определяется какое значение варьирующего признака ей соответствует. При исчислении медианы интервального  ряда сначала определяются медианы  интервалов, а затем определяется какое значение варьирующего признака соответствует данной частоте. Для определения величины медианы используется формула:

где:   - нижняя граница модального интервала;

- величина  модального интервала;

- накопленная  частота интервала, предшествующего  медианному;

  - частота медианного интервала;

Медианный интервал не обязательно совпадает  с модальным.

Пример.Таблица 2.1.Распределение рабочих участка по квалификации

Тарифный  разряд рабочего (xi) Число рабочих, имеющих данный разряд (fi) Частости (wi) Накопленные частоты(Si)
1 2 3 4
2

3

4

5

6

1

5

8

4

2

0,05

0,25

0,40

0,20

0,10

1

6

14

18

20

Итого 20 1,00  
 

 
 

     Медиану можно определить графически. Для  этого строится кумулята. Для определения  Ме высоту наибольшей ординаты делят  пополам. Через полученную точку  проводятся прямую, параллельную оси  абсцисс до пересечения ее с кумулятой. Абсцисса точки пересечения и  является Ме.

     Наряду  с медианой для более полной характеристики совокупности применяют и другие значения вариантов, занимающих в ранжированном  ряду вполне определенное положение. К  ним относят квартили и децили.

     Квартили  делят ряд по сумме частот на 4 равные части, а децили на 10 равных частей. Квартилей насчитывается три, а  децилей  – девять.

     Расчёт  этих показателей вариационном ряду аналогичен расчёту медианы. Он начинается с нахождения порядкового номера соответствующего варианта и определения  по накопленным частотам того интервала, в котором этот вариант находится.  Формулы для квартилей в интервальном вариационном ряду имеют следующий  вид:

нижний (или первый квартиль):

 ,

верхний (или третий квартиль):

, где

  – нижние границы соответствующих квартильных интервалов;

  • – величина соответствующего интервала;

- сумма частот ряда;

  – накопленные частоты интервалов, предшествующие соответствующим квартильным;

  – частоты соответствующих квартильным интервалов.

Вторым  квартилем является медиана.

     По  соотношению между средней арифметической, модой и медианой можно судить о характере распределения. В  симметричных распределениях все три  показателя совпадают. Чем больше расхождение  между модой и средней арифметической, тем больше ассиметричен ряд.

   Эмпирически установлено, что для умеренно ассиметричных  рядов разность между модой и  средней арифметической примерно в 3 раза превышает разность между  медианой и средней  Это соотношение можно использовать в отдельных случаях для определения третьего показателя по двум известным.

Абсолютные  и относительные  показатели

   Для измерения вариации признака используют как абсолютные, так и относительные  показатели.

   К абсолютным показателям вариации относят: размах вариации, среднее линейное отклонение, среднее квадратическое отклонение, дисперсию.

   К относительным показателям вариации относят: коэффициент осцилляции, линейный коэффициент вариации, относительное  линейное отклонение и др.

   Размах  вариации R. Это самый доступный  по простоте расчета абсолютный показатель, который определяется как разность между самым большим и самым  малым значениями признака у единиц данной совокупности:

 

   Размах  вариации (размах колебаний) - важный показатель колеблемости признака, но он дает возможность  увидеть только крайние отклонения, что ограничивает область его  применения. Для более точной характеристики вариации признака на основе учета  его колеблемости используются другие показатели.

     Среднее линейное отклонение d, которое вычисляют  для того, чтобы учесть различия всех единиц исследуемой совокупности. Эта величина определяется как средняя  арифметическая из абсолютных значений отклонений от средней. Так как сумма  отклонений значений признака от средней  величины равна нулю, то все отклонения берутся по модулю.

Формула среднего линейного отклонения (простая):

       
 

Формула среднего линейного отклонения (взвешенная):

     При использовании показателя среднего линейного отклонения возникают  определенные неудобства, связанные  с тем, что приходится иметь дело не только с положительными, но и  с отрицательными величинами, что  побудило искать другие способы оценки вариации, чтобы иметь дело только с положительными величинами. Таким  способом стало возведение всех отклонений во вторую степень. Обобщающие показатели, найденные с использованием вторых степеней отклонений, получили очень  широкое распространение. К таким  показателям относятся среднее  квадратическое отклонение  ϭ и среднее квадратическое отклонение в квадрате ϭ², которое называют дисперсией.

Средняя квадратическая простая: 
 
 

Средняя квадратическая взвешенная:

Информация о работе Статистическое изучение вариации массовых явлений