Автор работы: Пользователь скрыл имя, 07 Ноября 2011 в 18:18, курсовая работа
При изучении социально-экономических явлений и процессов статистика встречается с разнообразной вариацией признаков, характеризующих отдельные единицы совокупности. Величины признаков колеблются, варьируют под действием различных причин и условий, которые в статистике называются факторами. Нередко эти факторы действуют в противоположном направлении и сами, в свою очередь, варьируют. Среди них есть существенные факторы, определяющие величину вариантов данного признака у всех единиц совокупности. Но есть и несущественные (чисто случайные), которые на одни единицы совокупности могут оказывать влияние, на другие нет. Вариация, порождаемая существенными факторами, носит систематический характер, т.е. наблюдается последовательное изменение вариантов признака в определенном направлении. Такая вариация называется систематической.
Введение
При
изучении социально-экономических
явлений и процессов статистика
встречается с разнообразной
вариацией признаков, характеризующих
отдельные единицы
Вариация, обусловленная случайными факторами, называется случайной вариацией. Здесь не наблюдается систематического изменения вариантов зависимого признака от случайных факторов; все изменения носят хаотический характер, поскольку нет устойчивой связи этих факторов с единицами изучаемой совокупности.
Вариация зависимого признака, образовавшаяся под действием всех без исключения влияющих на него факторов, называется общей вариацией. Следовательно, общая вариация слагается из систематической и случайной вариации. Но систематическая вариация, если между признаками имеется довольно существенная связь, в конце концов, пробивает себе дорогу через хаос случайных колебаний вариантов зависимого признака и проявляет себя.
Наличие вариации признаков, изучаемых статистикой явлений, ставит задачу определить меру вариации, ее измерение, найти соответствующие измерители – показатели, характеризующие размеры этой вариации, а также выявить сущность и методы вычисления определяющих ее факторов.
По
степени вариации изучаемые явления
можно рассматривать с
Для
характеристики закономерностей распределения
изучаемого признака недостаточно пользоваться
только вариационными рядами распределения
и их графическим изображением. В
процессе анализа требуется вычислить
различные числовые характеристики
(показатели), которые в обобщенном
виде отразят особенности распределения
изучаемых признаков. Наличие таких характеристик
(показателей) существенно облегчает сравнение
различных распределений между собой.
ГЛАВА 1. Понятие вариации. Вариационный ряд, его виды.
Вариация (от лат. variation — перемена, изменение) — термин, введённый в математику Ж. Л. Лагранжем в 1762 году в работе «Essai d’une nouvelle méthode pour déterminer les maxima et les minima des formules intégrates indéfines» для обозначения малого смещения независимого переменного или функционала. Понятие «вариация» было введено в рамках метода вариаций исследования экстремальных задач, основанного на малых смещениях аргумента и изучения того, как в зависимости от них изменяются функционалы. Этот метод является одним из основных методов при решении задач на экстремум (отсюда и название раздела математики, изучающего данную проблематику — «Вариационное исчисление»).
Вариация даёт возможность оценить степень воздействия на данный признак других варьирующих признаков, установить, например, какие факторы и в какой степени влияют на смертность населения, финансовое положение предприятий, урожайность пшеницы и т. п.
Вариация существует в пространстве и во времени. Под вариацией в пространстве понимается колеблемость значений признака по отдельным территориям.
Объективно
существует также вариация во времени.
Под ней подразумевают
Вариация порождается комплексом условий, действующих на совокупность и ее единицы. Например, вариация оценок на экзамене в вузе порождается, в частности, различными способностями студентов, временем, затрачиваемым ими на самостоятельную работу, различием социально-бытовых условий и т. д. Именно вариация и предопределяет необходимость статистики. Если бы все студенты получали одинаковые оценки или, например, семьи имели одинаковые доходы, то необходимость в статистическом исследовании отпала бы.
Вариационный ряд, его виды.
Первым этапом статистического изучения вариации являются построение вариационного ряда - упорядоченного распределения единиц совокупности по возрастающим (чаще) или по убывающим (реже) значениям признака и подсчет числа единиц с тем или иным значением признака.
Существуют три формы вариационного ряда: ранжированный ряд, дискретный ряд, интервальный ряд. Вариационный ряд часто называют рядом распределения. Этот термин используется при изучении вариации как количественных, так и неколичественных признаков. Ряд распределения представляет собой структурную группировку.
Ранжированный ряд — это перечень отдельных единиц совокупности в порядке возрастания (убывания) изучаемого признака. Если численность единиц совокупности достаточно велика, ранжированный ряд становится громоздким, а его построение, даже с помощью ЭВМ, занимает длительное время. В таких случаях вариационный ряд строится с помощью группировки единиц совокупности по значениям изучаемого признака. Если признак принимает небольшое число значений, строится дискретный вариационный ряд. Дискретный вариационный ряд - это таблица, состоящая из двух строк или граф конкретных значений варьирующего признака хi и числа единиц совокупности с данным значением признака fi частот (f - начальная буква англ. слова frequency).
Определение числа групп. Число групп в дискретном вариационном ряду определяется числом реально существующих значений варьирующего признака. Если же признак может принимать, хотя и дискретные значения, но их число очень велико (например, поголовье скота на 1 января года в разных сельхозпредприятиях может составлять от нуля до десятков тысяч голов), тогда строится интервальный вариационный ряд. Интервальный вариационный ряд строится и для изучения признаков, которые могут принимать любые, как целые, так и дробные, значения в области своего существования. Таковы, например, рентабельность реализованной продукции, себестоимость единицы продукции, доход на 1 жителя города, доля лиц с высшим образованием среди населения разных территорий и вообще все вторичные признаки, значения которых рассчитываются путем деления величины одного первичного признака на величину другого.
Интервальный вариационный ряд представляет собой таблицу, (состоящую из двух граф (или строк) — интервалов признака, вариация которого изучается, и числа единиц совокупности, попадающих в данный интервал (частот), или долей этого числа от общей численности совокупности (частостей).
При построении интервального вариационного ряда необходимо выбрать оптимальное число групп (интервалов признака) и установить длину интервала. Поскольку при анализе вариационного ряда сравнивают частоты в разных интервалах, необходимо, чтобы величина интервала была постоянной. Оптимальное число групп выбирается так, чтобы в достаточной мере отразилось разнообразие значений признака в совокупности и в то же время закономерность распределения, его форма не искажалась случайными колебаниями частот. Если групп будет слишком мало, не проявится закономерность вариации; если групп будет чрезмерно много, случайные скачки частот исказят форму распределения. Чаще всего число групп в вариационном ряду устанавливают, придерживаясь формулы, рекомендованной американским статистиком Стерджессом (Sturgess) в 1926 г.:
k=1+3.32 lg n;
где k - число групп; n - численность совокупности.
Эта формула показывает, что число групп - функция объема данных.
Предположим, необходимо построить вариационный ряд распределения предприятий области по урожайности зерновых культур за какой-то год. Число сельхозпредприятий, имевших посевы зерновых культур, составило 143; наименьшее значение урожайности равно 10,7 ц/га, наибольшее - 53,1 ц/га. Имеем:
Так как число групп целое, следовательно, рекомендуется построить 8 или 9 групп.
Определение величины интервала
Зная число групп, рассчитывают величину интервала:
В нашем примере величина интервала составляет:
а) при 8 группах
б) при 9 группах
Для построения ряда и анализа вариации значительно лучше иметь по возможности округленные значения величины интервала и его границ. Поэтому наилучшим решением будет построение вариационного ряда с 9 группами с интервалом, равным 5 ц/га. Графическое изображение этого вариационного ряда приведено на рис.1.1
Границы
интервалов могут указываться разным
образом: верхняя граница предыдущего
интервала повторяет нижнюю границу
следующего, как показано в табл. 1.1 , или
не повторяет. В последнем случае второй
интервал будет обозначен как 15,1-20, третий
как 20,1-25 и т.д., т.е. предполагается, что
все значения урожайности обязательно
округлены до одной десятой. Кроме того,
возникает нежелательное осложнение с
серединой интервала 15,1-20, которая, строго
говоря, уже будет равна не 17,5, а 17,55; соответственно
при замене округленного интервала 40-60
на 40,1-6,0 вместо округленного значения
его середины 50 получим 50,5, Поэтому предпочтительнее
оставить интервалы с повторяющейся округленной
границей и договориться, что единицы
совокупности, имеющие значение признака,
равное границе интервала, включаются
в тот интервал, где это точное значение
впервые указывается. Так, хозяйство, имеющее
урожайность, равную 15 ц/га, включается
в первую группу, значение 20 ц/га -во вторую
и т. д.
Рис. 1.1.
Распределение хозяйств по урожайности
Таблица 1.1. Распределение сельскохозяйственных предприятий по урожайности зерновых культур
Группы хозяйств по урожайности, ц/га, | Число хозяйств, | Середина интервала, ц/га | Накопленная частота | |
10-15 | 6 | 12,5 | 75,0 | 6 |
15-20 | 9 | 17,5 | 157,5 | 15 |
20-25 | 20 | 22,5 | 450,0 | 35 |
25-30 | 41 | 27,5 | 1127,5 | 76 |
30-35 | 26 | 32,5 | 845,0 | 102 |
35-40 | 21 | 37,5 | 787,5 | 123 |
40-45 | 14 | 42,5 | 595,0 | 137 |
45-50 | 5 | 47,5 | 237,5 | 142 |
50-55 | 1 | 52,5 | 52,5 | 143 |
Итого | 143 |
Графическое изображение вариационного ряда
Существенную помощь в анализе вариационного ряда и его свойств оказывает графическое изображение. Интервальный ряд изображается столбиковой диаграммой, в которой основания столбиков, расположенные на оси абсцисс, — это интервалы значений варьирующего признака, а высоты столбиков - частоты, соответствующие масштабу по оси ординат. Графическое изображение распределения хозяйств области по урожайности зерновых культур приведено на рис. 1.1. Диаграмма этого рода часто называется гистограммой (от греческого слова «гистос» - ткань, строение).
Информация о работе Статистическое изучение вариации массовых явлений