Автор работы: Пользователь скрыл имя, 05 Апреля 2012 в 17:22, курсовая работа
В широком смысле статистика – наука, изучающая массовые явления, то есть явления, протекающие в совокупностях объектов некоторого рода и между взаимодействующими совокупностями. Массовое явление – множество однородных явлений, подверженных действию постоянных и случайных причин, закономерности которых могут проявится только в массе, совокупности. Статистическая совокупность – множество реально существующих материальных предметов, процессов или явлений, однородных по одному или нескольким признакам.
1. Введение
2. Анализ эмпирического распределения
3. Проведение выборочного наблюдения
4. Заключение
5. Список используемой литературы
34
СОДЕРЖАНИЕ:
1. Введение
2. Анализ эмпирического распределения
3. Проведение выборочного наблюдения
4. Заключение
5. Список используемой литературы
ВВЕДЕНИЕ.
В широком смысле статистика – наука, изучающая массовые явления, то есть явления, протекающие в совокупностях объектов некоторого рода и между взаимодействующими совокупностями. Массовое явление – множество однородных явлений, подверженных действию постоянных и случайных причин, закономерности которых могут проявится только в массе, совокупности. Статистическая совокупность – множество реально существующих материальных предметов, процессов или явлений, однородных по одному или нескольким признакам.
Уверенное использование статистики в практической экономической деятельности предполагает предварительное освоение этой теории и тех практических приёмов, которые она рекомендует при решении экономических задач.
Успешное освоение не означает знания наизусть всех формул, которые применяются в этой науке. К тому же существует масса программных продуктов, которые уже включают тот или иной статистический инструментарий, представленный в большей или меньшей степени. Но, чтобы воспользоваться этими программными продуктами, необходимо знать основные идеи, концепции, представлять основные положения и понятия теории статистики. Но и этого недостаточно, чтобы квалифицированно использовать имеющиеся специализированные и универсальные программные продукты, которые предполагают знание пользователем основных алгоритмов решения статистических задач, умение выбирать инструментарий, анализировать и оценивать полученные результаты. Одной из таких программ является ППП «STATGRAPHICS» применение которой позволяет производить изучение статистических совокупностей с большой полнотой и детализацией.
Анализ распределения значений варьирующего признака является первой или одной из первых задач статистической обработки данных, с которой статистик сталкивается в реальной жизни. Работа включает в себя такие взаимосвязанные разделы, как расчет основных выборочных статистик, построение интервального вариационного ряда и его графическое представление, расчет интервальных оценок генеральной средней и генеральной дисперсии, сглаживание эмпирического распределения некоторым модельным распределением, статистическая проверка гипотезы о правомерности выбранного варианта сглаживания. Исходными данными к работе являются либо случайная выборка из гипотетической генеральной совокупности, распределенной по заданному закону распределения, либо статистика, полученная в результате некоторого статистического наблюдения. Анализ изучаемой совокупности начнём с расчёта выборочных статистик:
Variable: K.K
------------------------------
Sample size 198
Average 315.773
Median 314.65
Mode 267.5
Variance 8086.57
Standard deviation 89.9254
Range 454
Lower quartile 242.5
Upper quartile 384.7
Skewness 0.173163
Kurtosis -0.439946
Coeff. of variation 28.4779
------------------------------
Рассчитаны следующие выборочные статистики:
Average — средняя арифметическая, рассчитываемая по формуле простой средней. Под средней арифметической понимается такое значение признака, которое имела бы каждая единица совокупности, если бы общий итог всех значений признака был распределён равномерно между всеми единицами совокупности
;
Median — медиана, лежит в середине ранжированного ряда и делит его пополам.
, если n — четное,
, если n — нечетное;
Mode — мода Мо – наиболее часто встречающееся значение признака у единиц данной совокупности. Она соответствует определённому значению признака. На практике моду находят, как правило, по сгруппированным данным. Определить моду в первичном ряду в точном соответствии с данным правилом возможно только при достаточно большом количестве наблюдений и при условии, что одно из индивидуальных значений изучаемого признака у отдельных единиц совокупности повторяется значительно чаще, чем все другие значения;
Variance — дисперсия – средняя из квадратов отклонений вариантов значений признака от их средней величины. Дисперсия и среднее квадратическое отклонение точнее характеризуют вариацию признака, т.к. они основаны на учёте колеблемости всех значений признака. Поскольку средняя арифметическая является обобщающей характеристикой свойств совокупности, большинство показателей вариации основано на рассмотрении отклонений значений признака отдельных единиц совокупности от этой величины.
;
Дисперсия обладает рядом свойств, некоторые из них позволяют упростить её вычисление:
дисперсия постоянной величины равна нулю;
если все варианты значений признака уменьшить на одно и то же число, то дисперсия не уменьшится;
если все варианты значений признака уменьшить а одно и то же число раз (к раз), то дисперсия уменьшится в раз.
Standard deviation — среднее квадратическое отклонение представляет собой корень квадратный из дисперсии:
;
Range — размах вариации, представляет собой разность между максимальным и минимальным значениями признака в изучаемой совокупности: R = Xmax - Xmin. Безусловным достоинством этого показателя является простота расчёта. Однако размах вариации зависит от величины только крайних значений признака, поэтому область его применения ограничена достаточно однородными совокупностями.
Если в качестве показателя центра распределения используется медиана, то для характеристики вариации признаков в совокупности можно применить так называемое квартильное отклонение. Это показатель можно применить вместо размаха вариации, чтобы избежать недостатков, связанных с использованием крайних значений:
, где
и - соответственно первая и третья квартили распределения. Квартили – это значения признака в ранжированном ряду распределения, выбранные таким образом, что 25% единиц совокупности будут меньше по величине ; 25% единиц будут заключены между и ; 25% -между и и остальные 25% превосходят
Lower quartile — нижний квартиль:
, где , ,
floor — округление до ближайшего целого,
ceiling — округление до ближайшего большего;
Upper quartile — верхний квартиль:
, где , ;
Skewness — асимметрия. Простейший показатель асимметрии основан на соотношении показателей центра распределения: чем больше разница между средними () тем больше асимметрия ряда.
;
Величина показателя асимметрии может быть положительной и отрицательной. Положительная величина показателя асимметрии указывает на наличие правосторонней асимметрии (правая ветвь относительно максимальной ординаты вытянута больше, чем левая). При правосторонней асимметрии между показателями центра распределения существует соотношение:
.
Отрицательный знак показателя асимметрии свидетельствует о наличии левосторонней асимметрии. Между показателями центра распределения в этом случае имеется такое соотношение:
.
В нашем примере показатель асимметрии равен 0.173163,
Kurtosis — коэффициент эксцесса (куртозис).
;
Эксцесс представляет собой выпад вершины эмпирического распределения вверх или вниз от вершины кривой нормального распределения. При положительной величине эксцесса – распределение островершинное, а при отрицательной величине – плосковершинное. Для данного распределения величина эксцесса отрицательная
(-0.439946), т.е. оно островершинное.
Coeff. of variation — коэффициент вариации (%)- наиболее часто применяемый показатель относительной колеблемости. Его используют не только для сравнительной оценки вариации, но и для оценки однородности совокупности. Совокупность считается однородной, если коэффициент вариации не превышает 33% (для распределений близких к нормальному). Для данной совокупности коэффициент вариации равен 28.4779%, т.е. эту совокупность можно считать однородной.
;
Значения изучаемых признаков без какой-либо систематизации образуют так называемый первичный ряд данных. При наличии достаточно большого количества вариантов значений признака первичный ряд становится трудно обозримым и непосредственное рассмотрение его не даёт представления о распределении единиц в совокупности. Первым шагом в упорядочении первичного ряда является его ранжирование, т.е. расположение всех вариантов ряда в возрастающем порядке. Ранжированный ряд данных позволяет сразу увидеть наибольшее и наименьшее значение признака в совокупности, определить расстояние между крайними значениями признака, а также выявить наиболее часто повторяющееся значение в обследуемой совокупности. Использование ранжированного ряда также позволяет легко разделить все данные по группам.
Variable: K.K (length = 198)
------------------------------
( 1) 112.8 ( 19) 205.6 ( 37) 231.7 ( 55) 248 ( 73) 278.3
( 2) 125.4 ( 20) 210.3 ( 38) 231.7 ( 56) 249.2 ( 74) 279.7
( 3) 128.7 ( 21) 212.7 ( 39) 231.8 ( 57) 253.9 ( 75) 281
( 4) 148.1 ( 22) 215 ( 40) 231.9 ( 58) 256.3 ( 76) 282
( 5) 148.6 ( 23) 215.5 ( 41) 232.9 ( 59) 256.6 ( 77) 282.2
( 6) 153.4 ( 24) 216.2 ( 42) 233.8 ( 60) 257.3 ( 78) 283.9
( 7) 161.7 ( 25) 217 ( 43) 235.5 ( 61) 259.5 ( 79) 284.1
( 8) 162.6 ( 26) 220.3 ( 44) 237.4 ( 62) 264.8 ( 80) 285.2
( 9) 164.1 ( 27) 221.2 ( 45) 238 ( 63) 264.9 ( 81) 285.5
( 10) 166.9 ( 28) 222.9 ( 46) 238.5 ( 64) 267.5 ( 82) 285.9
( 11) 167.8 ( 29) 226.7 ( 47) 239.8 ( 65) 267.5 ( 83) 287.1
( 12) 175.8 ( 30) 226.9 ( 48) 241.5 ( 66) 268.1 ( 84) 289
( 13) 176.4 ( 31) 227.3 ( 49) 242.2 ( 67) 269.3 ( 85) 289.9
( 14) 186 ( 32) 227.5 ( 50) 242.5 ( 68) 270.3 ( 86) 291.6
( 15) 191.7 ( 33) 227.8 ( 51) 243.6 ( 69) 271.2 ( 87) 293.4
( 16) 197.7 ( 34) 228.1 ( 52) 243.7 ( 70) 273.7 ( 88) 296.5
( 17) 202.5 ( 35) 230 ( 53) 246.1 ( 71) 274.3 ( 89) 297.9
( 18) 204 ( 36) 231.2 ( 54) 246.2 ( 72) 274.9 ( 90) 299.7
------------------------------
------------------------------
( 91) 301.9 (109) 325.3 (127) 349.9 (145) 375.9 (163) 403.3
( 92) 303.2 (110) 325.4 (128) 351.4 (146) 379.3 (164) 403.5
( 93) 303.6 (111) 325.6 (129) 353 (147) 379.7 (165) 404.1
( 94) 306.2 (112) 327.4 (130) 353.2 (148) 383.5 (166) 404.3
( 95) 308.3 (113) 327.6 (131) 354.4 (149) 384.7 (167) 404.6
( 96) 308.3 (114) 328.1 (132) 355.6 (150) 384.8 (168) 406.6
( 97) 308.4 (115) 330.8 (133) 356.3 (151) 385.5 (169) 407.8
( 98) 309.8 (116) 331.6 (134) 357 (152) 387.9 (170) 413.2
( 99) 314.6 (117) 331.8 (135) 361.2 (153) 388.9 (171) 416
(100) 314.7 (118) 332.1 (136) 364.1 (154) 389.8 (172) 424
(101) 319.3 (119) 335.9 (137) 364.3 (155) 392.1 (173) 424.3
(102) 320.5 (120) 340.6 (138) 365.3 (156) 392.7 (174) 427.1
(103) 321 (121) 341.2 (139) 366.2 (157) 393 (175) 429.1
(104) 323.5 (122) 344.2 (140) 366.7 (158) 394.5 (176) 429.6
(105) 323.6 (123) 345.3 (141) 367.3 (159) 395.2 (177) 430.2
(106) 324.2 (124) 345.7 (142) 367.6 (160) 398.9 (178) 436.7
(107) 324.9 (125) 346.8 (143) 372 (161) 399.6 (179) 436.9
(108) 325 (126) 348.3 (144) 374.4 (162) 400.5 (180) 437.6
------------------------------
--------------
(181) 439.8
(182) 443.2
(183) 445
(184) 445.2
(185) 451.6
(186) 453.1
(187) 457.4