Группировка статистических данных

Автор работы: Пользователь скрыл имя, 12 Октября 2011 в 19:28, реферат

Краткое описание

Группировка — это распределение единиц совокупности по группам в соответствии с группировочным признаком. Назначение группировки состоит в том, что этот метод обеспечивает обобщение данных, представление их в компактном, обозримом виде. На основе группировки рассчитываются сводные показатели по группам, появляется возможность их сравнения, изучения взаимосвязей между признаками.

Содержимое работы - 1 файл

ГРУППИРОВКА СТАТИСТИЧЕСКИХ ДАННЫХ.docx

— 217.15 Кб (Скачать файл)

      Ряд распределения состоит из следующих  элементов:

        — варианта — отдельное, возможное значение признака i=1, 2, ...,n, где n — число значений признака;

        — частоты — численность отдельных групп соответствующих значений признаков;

      Nобъём совокупности — общее число элементов совокупности;

        — частость - доля отдельных групп во всей совокупности;

        — величина интервала.

      Если  вариационный ряд представлен неравными  интервалами, то рассчитывается абсолютная и относительная плотности распределения.

      Абсолютная  плотность h — это отношение частоты к величине интервала, а относительная плотность — это отношение частости к величине интервала:

.

      Ряд распределения по частоте (частости) в целом характеризует структуру  совокупности по данному признаку. Однако для описания распределения  совокупности могут использоваться и кумулятивные ряды, т.е. ряды накопленных  частот (или частостей), которые иногда имеют даже некоторые преимущества.

      Накопленная частота (частость) данного значения признака —это число (доля) элементов совокупности, индивидуальные значения признака которых не превышают данного.

            Таблица 5.

Собственные оборотные  средства Середины интервалов; Кол-во предприятий  в группе, ед.; Накопленные частоты xifi xi-
(xi-
)2
 
X xi fi
1 370-786 578 20 20 11560 -391,04 152912,282 3058245,63
2 786-1202 994 22 42 21868 25 625 13750
3 1202-1618 1410 3 45 4230 441 194481 583443
4 1618-2034 1826 1 46 1826 857 734449 734449
5 2034-2450 2242 4 50 8968 1273 1620529 6482116
    50     2204,96 2702996,28 10872003,6

       Размах  вариации:

       ∆ = = = 416;

       Среднее значение признака:

        = = 969,04;

В среднем предприятия  имеют собственные оборотные  средства в размере 969,04 тыс. рублей.

 

Дебиторская задолжность Середина интервала В% к итогу Количество предприятий Накопленное количество предприятий xi*Ni Xi-x ̅ (xi-x ̅)² (xi-x ̅)²*Ni
до 7 7,5 22 11 11 82,5 -1,21 1,4641 16,1051
7 7 12 6 17 42 -1,71 2,9241 17,5446
8 8 18 9 26 72 -0,71 0,5041 4,5369
9 9 36 13 39 117 0,29 0,0841 1,0933
10 10 6 3 42 30 1,29 1,6641 4,9923
11 и  более 11,5 16 8 50 92 2,79 7,7841 62,2728
    100 50   435,5 0,74 14,4246 106,545

      Таблица 6. 

==8,49 

Средняя дебиторская  задолженность предприятий на конец  года составляет 8,71 тыс. рублей.

Интервальный  ряд распределения изображается графически в виде гистограммы. При её построении на оси абсцисс откладывают интервалы ряда. Над осью абсцисс строятся прямоугольники, основанием которых является интервал, а высота — соответствующая этому интервалу плотность распределения. 
 

 
 

Изображением  ряда накопленных частот служит кумулята. Накопленные частоты наносятся в системе координат в виде ординат для границ интервалов; соединяя нанесенные точки отрезками прямых, получаем кумуляту.

 
 
 
 
 
 
 
 
 
 

      

       

      Изображением  дискретного ряда распределения  является полигон. В системе координат по оси абсцисс откладываются варианты , по оси ординат — частоты (частости), затем отмечают точки с координатами , которые последовательно соединяются отрезками прямой.

 
 
 
 
 
 
 
 
 
 
 
 
 
 

      Медиана - это такое значение признака, которое делит объём совокупности пополам в том смысле, что число элементов совокупности с индивидуальными значениями признака, меньшими медианы, равно числу элементов совокупности с индивидуальными значениями больше медианы.

,

      где — начало интервала, содержащего медиану;

        — величина интервала,  содержащего медиану;

        — накопленная частота  на начало интервала, содержащего  медиану;

      N — объём совокупности;

        — частота того интервала, в котором расположена медиана.

  1. Me[x]=786+416*=880.54
  2. Me[x]=8
 

      Мода — наиболее часто встречающееся значение признака в совокупности.

      Для дискретного ряда — это то значение, которому соответствует наибольшая частота распределения. Для интервального  ряда в начале определяется интервал, содержащий моду, - тот, которому соответствует  наибольшая плотность распределения. Затем приближённо определяется численное значение моды.

      Если  ряд равноинтервальный, то используется формула:

;

      где — начало интервала, содержащего моду;

        — величина интервала,  содержащего моду;

        — частота того интервала,  в котором расположена мода;

        — частота интервала, предшествующего  модальному;

        — частота интервала, следующего  за модальным.

      Средняя величина характеризует только уровень, закономерный для данной совокупности, В ряде случаев одно и то же численное  значение средней может характеризовать  совершенно различные совокупности. Поэтому для того чтобы судить о типичности средней величины для данной совокупности, её следует дополнить показателями, характеризующими вариацию (колеблемость) признака. Наиболее распространёнными из них являются дисперсия, среднее квадратичное отклонение, коэффициент вариации. 
 

  1. Mo[x]=786+416*=351,02
  2. Mo[x]=9

    Дисперсия — это среднее из квадратов отклонений от средней величины, для вариационного ряда она определяется по формуле:

    . 

    Если  ряд интервальный, то в качестве варианты , также как при расчете средней, берется середина интервала.

    При использовании калькулятора, а также  для дискретных рядов распределения  более удобной может быть другая формула вычисления дисперсии:

    Наиболее  широко в статистике применяется  такой показатель вариации, как  среднее квадратичное отклонение , который представляет собой квадратный корень из дисперсии.

    1. =
      =466,29
    2. =
      =1,459
 

      Относительным показателем колеблемости признака в данной совокупности, является коэффициент вариации (V):

.

      Коэффициент вариации позволяет сравнивать вариации различных признаков, а также  одноименных признаков в разных совокупностях.

V=*100%=48,11% - собственные оборотные средства.

V=*100%=16,75% - дебиторская задолженость.

Сделанные выше вычисления позволяют сделать вывод: можно судить о большой колеблемости собственных оборотных средств 50 предприятий (большой коэффициент вариации 48,11%, высокое значение среднего квадратичного отклонения – 466,29 тыс. руб., значительный разброс

значений медианы  – 880,54 тыс. руб., моды – 351,02 тыс. руб. и среднего

арифметического – 969,04 тыс. руб.). По признаку №2, напротив, можно

констатировать  небольшой размах вариации (невысокий  коэффициент

вариации 16,75%, малое значение среднего квадратичного отклонения - 1,459

тыс. руб., незначительный разброс значений медианы – 8 тыс. руб., моды

- 9тыс. руб. и среднего арифметического – 8,49 тыс. руб.).

3. СТАТИСТИЧЕСКИЕ МЕТОДЫ  АНАЛИЗА ВЗАИМОСВЯЗИ

      С помощью корреляционного анализа  изучить связь между признаками, указанными в Вашем варианте. Для  этого:

  1. Построить, эмпирическую линию регрессии.
  2. Оценить тесноту связи между признаками, рассчитав коэффициент детерминации, коэффициент корреляции.
  3. Найти линейное уравнение связи, график которого представить в той же системе координат, что и эмпирическая линия регрессии.
  4. Интерпретировать полученные результаты, сделать выводы.
 

       Различают два типа связей между различными явлениями и их признаками:

  1. функциональная (детерминированная) – изменение признака-результата полностью обусловлено изменением признака-фактора.
  2. статистическая (корреляционная) - изменение признака-результата обусловлено влиянием признака-фактора не полностью, а лишь в некоторой мере, так как существует еще влияние других причин, многие из которых неизвестны.

Информация о работе Группировка статистических данных