Группировка статистических данных

Автор работы: Пользователь скрыл имя, 06 Ноября 2012 в 13:17, контрольная работа

Краткое описание

Под группировкой понимают распределение единиц изучаемой статистической совокупности на более или менее однородные группы по существенным для изучаемого явления признакам и характеристика этих групп системой показателей.
Основные виды группировок:
типологические для выделения качественно однородных совокупностей (социально-экономических типов);
структурные для характеристики структуры явления и структурных сдвигов;
аналитические для изучения взаимосвязей между явлениями или их отдельными признаками.

Содержимое работы - 1 файл

курсовая по статистике.docx

— 138.14 Кб (Скачать файл)

Раздел I. Группировка статистических данных.

 

Группировка статистических данных является вторым после наблюдения этапом статистического  исследования.

Под группировкой понимают распределение единиц изучаемой  статистической совокупности на более  или менее однородные группы по существенным для изучаемого явления признакам  и характеристика этих групп системой показателей.

Основные виды группировок:

  • типологические для выделения качественно однородных совокупностей (социально-экономических типов);
  • структурные для характеристики структуры явления и структурных сдвигов;
  • аналитические для изучения взаимосвязей между явлениями или их отдельными признаками.

Признак, на основе которого производится разделение единиц изучаемого явления  на группы, называется группировочным признаком. Группировочные признаки делятся на атрибутивные (качественные) и количественные.

При группировке по атрибутивному  признаку число групп определяется числом разновидностей изучаемого признака в данной совокупности.

При группировке по количественному  признаку число групп определяется в зависимости от характера изменения  признака — дискретное (прерывное) или непрерывное. Интервалом называется разница между максимальным и минимальным значениями признака в каждой группе. При обработке статистических данных используют три вида интервалов: равные, неравные (прогрессивно увеличивающиеся) и специализированные. Последние используются в типологических группировках, когда границы устанавливают при переходе от одного качества к другому (например, группировки хозяйствующих субъектов по формам собственности).

Величина  равных интервалов определяется по формуле:

  K= (Xmax -Xmin)/i     ,

где Xmax, Xmin – соответственно наибольшее и наименьшее значения признака в изучаемой совокупности; i – принятое число групп.

K= (1203-232)/6 = 971/6 = 161.             

Результаты  группировки и сводки излагаются в виде статистической таблицы.

Зависимость между  размером предприятия по стоимость  ОПФ и выпуском товаров и услуг.

Группы предприятий по среднемесячной стоимости ОПФ, тыс.р.

Количество предприя-тий.

Выпуск товаров и услуг в  целом по группе, тыс .р.

Средний выпуск товаров и услуг, тыс. р.

Изменение среднего выпуска товаров  и услуг по сравнению с первой группой, %

232-393

4

3698

   924,5

100,00%

393-554

8

   9660

1207,5

130,61%

554-715

7

10201

1457,3

157,63%

715-876

6

10135

1689,2

182,71%

876-1037

3

6646

2215,3

239,62%

1037-1198

2

4200

2100

227,14%

Итого:

30

44540

9413,8

 

Вывод: С увеличением размера предприятия (стоимости ОПФ) происходит рост выпуска товаров и услуг. При стоимости ОПФ               тыс. руб. достигается максимальное значение. Далее следует снижение объёмов выпуска из-за отрицательного эффекта масштаба производства.

 

Раздел II. Ряды распределения.

Первым этапом статистического  исследования является статистическое наблюдение, позволяющее получить данные об изучаемом объекте (статистическую совокупность).

Совокупность, полученная при непосредственном наблюдении и представленная в том порядке, как она получена, называется первоначальной таблицей или первоначальным рядом:

Xi

784

448

560

968

392

336

712

808

544

632

457

232

536

296

453

                           

Xi

712

649

1080

1027

1203

468

784

512

998

848

672

448

785

672

800


 

Отдельные числовые значения признака называют вариантами и обозначают Х1, Х2, ..., Хn.

Абсолютное  число, показывающее повторяемость  того или иного варианта, называют частотой и обозначают т1, т2, ..., тk. Первоначальный ряд, перестроенный в порядке возрастания или убывания значений признака, называют упорядоченным или ранжированным рядом.

Если  отдельные значения признака повторяются  в данном ранжированном ряду, то указывают, сколько раз тот или  иной вариант повторяется. Такой  ряд называется вариационным рядом:

Xi

232

296

336

392

448

453

457

468

512

536

544

560

632

649

672

mi

1

1

1

1

2

1

1

1

1

1

1

1

1

1

2

                           

Xi

712

784

785

800

808

848

968

998

1027

1080

1203

mi

2

2

1

1

1

1

1

1

1

1

1


 

Изменение признака у различных единиц совокупности называется вариацией. Вариация может быть дискретной и непрерывной. Дискретной называется вариация, когда отдельные значения признака отличаются друг от друга на некоторую конечную величину, например, парк автомобилей, число рабочих, количество погрузо-разгрузочных устройств и т.д.

Непрерывной называется такая вариация, когда  варианты могут отличаться друг от друга на сколь угодно малую величину, например, время реакции водителей, тормозной путь, скорость движения и т.д.

Из  этих определений вытекает, что распределения  могут быть как дискретными, так  и непрерывными.

В случае непрерывной вариации (часто  и дискретной) для построения вариационного  ряда пользуются интервальным распределением признака, т.е. частоты относят не к отдельным значениям признака, а к интервалам.

Для выбора величины интервала группировки  используется формула Стерджесса:

( n=30)

 

==164

 

 

 

 

Расчёт средней арифметической и показателей вариации.

Интервалы по xi

xцi

mi

xцi*mi

232-396

314

4

1256

333,5

1334

111222,3

444889

396-560

478

9

4302

169,5

1525,5

28730,25

258572,25

560-724

642

6

3852

5,5

33

30,25

181,5

724-888

806

6

4836

158,5

951

25122,25

150733,5

888-1052

970

3

2910

322,5

967,5

104006,3

312018,75

1052-1216

1134

2

2268

486,5

973

236682,3

473364,5

Итого:

 

30

19424

 

5784

 

1639759,5


 

Средняя арифметическая для интервального ряда рассчитывается по формуле:

=  1924/30 =  647.5 тыс.руб.

где xцi – центр i-ого интервала;

mi – частота в i-ом интервале.

 

Показатели вариации.

Показатели вариации позволяют  измерить колеблемость значений признака у отдельных единиц совокупности относительно средней, как постоянной величины для данной совокупности.

Для анализа степени  вариации рассчитывают следующие абсолютные показатели; размах вариации, среднее  линейное отклонение, среднее квадратическое отклонение. Для сравнения вариаций признака в разных совокупностях или вариаций разных признаков в одной совокупности служат относительные показатели — коэффициенты вариации.

 

Размах вариации: R=  Xmax -Xmin.

Недостаток  этого показателя — случайность  экстремальных значений признака в  данной совокупности.

R= 1203 - 232 =971  тыс.руб.

 

Среднее линейное отклонение:

   Pвзв  =  5784\30=192,8 тыс.руб.

 

   Среднее квадратическое отклонение d:

 

 

d взв = =234

 

 

 

 

 

 

Мерой рассеивания значений варьирующего признака является дисперсия d2:

 

 

d2=6187320\30=54658,6 тыс.руб

 

 

Коэффициенты  вариации определяются по формулам:

 

 

192,8\647,5*100=29%

 

 

233 \647,5*100=34%

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Мода и медиана.

В качестве характеристик вариационного  ряда применяют непараметрические средние – моду и медиану.

 

интервалы

Mi

∑Mi

232-396

4

4

396-560

9

13

560-724

6

19

724-888

6

25

888-1052

3

28

1052-1216

2

30




 

 

 

 

 

 

 

 

 

Медиана Ме – это такое значение варьирующего признака, которое приходится на середину упорядоченного вариационного ряда.

Медианным является первый интервал, для которого Smi превышает половину от общего числа наблюдений (30/2=15). Т.о. интервал 560-724 – медианный, т.к.

Smi = 4+9+6 =19 > 15.

,

где - нижняя граница медианного интервала;

K – величина интервала;

- половина накопленных частот;

- накопленная частота интервала,  предшествующего медианному;

- частота медианного интервала..

 

Мода М0 – это вариант, наиболее часто встречающийся в данном вариационном ряду.

Модальный интервал определяется по наибольшей частоте. Т.о. интервал

  396-560 – модальный, т.к. mi = 9 (=max).

,

где - нижняя граница модального интервала;

K – величина интервала;

-частота интервала;

- частота интервала, предшествующего  модальному;

- частота интервала, следующего  за модальным.

 

Графические методы изображения вариационных рядов.

  1. Полигон.
  2. Гистограмма.
  3. Кумулята.

 

Вывод: По величине коэффициента вариации можно судить о степени вариации признаков совокупностей. Чем больше его величина, тем больше разброс значений признака вокруг средней, тем менее однородна совокупность по своему составу и тем менее представительна средняя. Таким образом, коэффициент вариации – критерий типичности средней. В данном случае коэффициент вариации,                 следовательно, средняя  нетипична и вариация неумеренная.

Сравнение моды, медианы и средней позволяет  судить о характере распределения  признака в совокупности. В данном случае распределение асимметрично, т.к.  эти характеристики не равны  между собой.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Раздел III.Дисперсия. Виды дисперсий. Закон сложения дисперсий.

Существуют  следующие виды дисперсий: общая, внутригрупповая и межгрупповая.

Вид дисперсий определяется характером совокупности, рассеивание значений которой она измеряет.

Информация о работе Группировка статистических данных