Автор работы: Пользователь скрыл имя, 13 Марта 2012 в 14:50, реферат
Сводка - особая стадия статистического исследования, в ходе которой систематизируются первичные материалы статистического наблюдения.
По глубине и точности обработки материала различают сводку простую и сложную.
1.Сводка
2.Группировка
3.Выполнение группировки по количественному признаку
Формула Стерджесса пригодна при условии, что распределение единиц совокупности по данному признаку приближается к нормальному, и при этом применяются равные интервалы в группах. Чтобы получить группы, адекватные действительности, необходимо руководствоваться сущностью изучаемого явления.
Интервалы могут быть равные и неравные. При исследовании экономических явлений могут применяться неравные (прогрессивно возрастающие, прогрессивно убывающие) интервалы. Так, например, по численности работающих промышленные предприятия могут быть разбиты на следующие группы: до 100 человек, 100 - 200, 200 - 300, 300 - 500, 500 - 1000, 1000 и более человек. Это объясняется тем, что количественные изменения размера признака имеют неодинаковые значения в низших и высших по размеру признака группах: изменение количества работающих на 50 - 100 человек имеет существенное значение для мелких предприятий, а для крупных - не имеет.
Для группировок с равными интервалами величина интервала
i = ,
где xmax, xmin наибольшее и наименьшее значения признака, n - число групп.
Если, например, требуется произвести группировку с равными интервалами по данным об уровне месячной заработной платы рабочих, которая в 1995 г. колебалась в пределах от 600 до 750 тыс. руб., и необходимо при этом выделить 5 групп, то величина интервала, тыс. руб.:
i = (750 – 600)/5 = 30
Если в результате деления получится нецелое число и возникнет необходимость в округлении, то округлять нужно, как правило, в большую сторону, а не в меньшую. Прибавляя к минимальному значению признака (в данном случае 600 тыс. руб.) найденное значение интервала, получаем верхнюю границу первой группы, тыс. руб.:
600 + 30 = 630.
Прибавляя далее значение интервала к верхней границе первой группы, получаем верхнюю границу второй группы
630 + 30 = 660, и т. д.
В результате получим такие группы рабочих по размеру заработной платы, тыс. руб.:
600 - 630; 630 - 660; 660 - 690; 690 - 720; 720 - 750.
В этом распределении имеет место неопределенность: к какой группе, например, отнести рабочего с заработком в 630 тыс. руб., к первой или второй? Для устранения неопределенности открывают один из крайних интервалов или используют принцип единообразия - левое число включает в себя обозначенное значение, а правое - не включает. Значит рабочий, получающий 630 тыс. руб., должен быть отнесен ко второй группе. Аналогично нужно поступать в отношении всех остальных групп.
Интервалы групп могут быть закрытыми, когда указаны нижняя и верхняя границы (как в приведенном примере), и открытыми, когда указана лишь одна из границ (первый или последний интервалы, величина которых принимается равной величине смежных с ними интервалов). Во втором случае, чтобы показать, что рабочий с заработной платой, равной, например, верхней границе интервала, включается в последнюю группу, ее следует обозначить «750 и выше». И наоборот, чтобы показать, что значение, равное верхней границе интервала, не входит в данную группу, последнюю группу нужно обозначить «свыше 750». Подобные функции выполняют слова «до», «менее» и «более».
Иногда приходится пользоваться уже имеющимися группировками, которые не удовлетворяют требованиям анализа. Для приведения таких группировок к сопоставимому виду в целях их дальнейшего сравнительного анализа используется метод вторичной группировки, являющейся особым видом группировки.
Вторичная группировка - образование новых групп на основе ранее осуществленной группировки.
Получение новых групп на основе имеющихся возможно двумя способами перегруппировки: объединением первоначальных интервалов (путем их укрупнения) и долевой перегруппировкой (на основе закрепления за каждой группой определенной доли единиц совокупности).
4.Статистический ряд распределения
После определения группировочного признака и границ групп строится ряд распределения.
Статистический ряд распределения представляет собой упорядоченное распределение единиц изучаемой совокупности на группы по определенному варьирующему признаку.
Ряды распределения, построенные по качественным признакам, называются атрибутивными.
Ряды распределения, построенные по количественному признаку (в порядке возрастания или убывания наблюдаемых значений), называются вариационными.
Вариационные ряды распределения состоят из двух элементов: вариантов и частот.
Числовые значения количественного признака в вариационном ряду распределения называются вариантами. Они могут быть положительными и отрицательными, абсолютными и относительными. Так, при группировке предприятий по результатам хозяйственной деятельности варианты - положительные (прибыль) или отрицательные (убыток) числа.
Частоты - это численности отдельных вариантов или каждой группы вариационного ряда, т. е. это числа, показывающие как часто встречаются те или иные варианты в ряду распределения. Сумма всех частот называется объемом совокупности и определяет число элементов всей совокупности.
Частости - это частоты, выраженные в виде относительных величин (долях единиц или процентах). Сумма частостей равна единице или 100%.
Накопленные частоты – сумма частоты данного интервала и всех частот интервалов, предшествующих данному.
Вариационные ряды в зависимости от характера вариации подразделяются на дискретные и интервальные. Дискретные вариационные ряды основаны на дискретных (прерывных) признаках, имеющих только целые значения (например, тарифный разряд рабочих, число детей в семье); на дискретных признаках, представленных в виде интервалов; интервальные - на непрерывных признаках (принимающих любые значения, в том числе и дробные).
Первым шагом в упорядочении первичного ряда является его ранжирование, т.е. расположение всех вариантов в возрастающем (или убывающем) порядке.
Например, стаж работы (годы) 22 рабочих бригады характеризуется следующими данными: 2,4,5,5,6,6,5, 6,6,7,7,8,8,9,10,11,4,3,3,4,4,
Ранжированный ряд, построенный по этим данным:
2, 3, 3, 4, 4, 4, 4, 5, 5, 5, 5, 6, 6, 6, 6, 7, 7, 8, 8, 9, 10, 11.
При рассмотрении первичных данных можно видеть, что одинаковые варианты признака у отдельных единиц повторяются (здесь и далее f - частота повторения; n - объем изучаемой совокупности).
Способы построения дискретных и интервальных рядов различны.
Для построения дискретного ряда с небольшим числом вариантов выписываются все встречающиеся варианты значений признаках, а затем подсчитывается частота повторения варианта. Ряд распределения принято оформлять в виде таблицы, состоящей из двух колонок (или строк), в одной из которых представлены варианты, в другой - частоты. Построение дискретного вариационного ряда не составляет труда.
Для построения ряда распределения непрерывно изменяющихся признаков, либо дискретных, представленных в виде интервалов («от - до»), необходимо установить оптимальное число групп (интервалов), на которое следует разбить все единицы изучаемой совокупности. При группировке внутри однокачественной совокупности появляется возможность применения равных интервалов, число которых зависит от вариации признака в совокупности и от количества обследованных единиц.
Проиллюстрируем построение интервального вариационного ряда по данным приведенного ранее примера распределения рабочих по стажу работы.
Для нашего примера, согласно формуле Стерджесса, при N =22 число групп n = 5. Зная число групп, определим интервал по формуле:
I=(xmax – xmin)/ n =(11 – 2) / 5=1,8 2
В результате получим следующий ряд распределения рабочих по стажу работы ( =22):
X 2-4 4-6 6-8 8-10 10-12
F 3 8 6 3 2
Как видно из данного распределения, основная масса рабочих имеет стаж работы от 4 до 8 лет.
Ряды распределения удобно изучать с помощью графического метода.