Автор работы: Пользователь скрыл имя, 27 Февраля 2012 в 14:32, контрольная работа
Среди различных форм и видов частичного статистического наблюдения особое и самое важное место занимает выборочное статистическое наблюдение, или выборочный метод. Наши знания, суждения и поступки в очень большой мере основаны на выборочных данных. Это утверждение одинаково справедливо как для повседневной жизни, так и для научных исследований.
Введение 2
1. Сущность и преимущества выборочного метода 3
2. Способы отбора единиц из генеральной совокупности 4
3. Ошибка выборки. 10
4. Определение необходимого объёма выборки 15
5. Малая выборка 18
6. Применение выборочного метода при изучение социально-экономических явлений. 20
Заключение 23
Список литературы 24
Одним из таких путей является многоступенчатый отбор, предполагающий подвыборку, которая заключается в отборе более мелких единиц из уже отобранных крупных, т.е. из генеральной совокупности сначала извлекаются укрупненные группы, потом – более мелкие и так до тех пор, пока не будут отобраны те единицы, которые подвергаются обследованию. Наиболее часто используется двухступенчатая форма многоступенчатой выборки.
В отличие от многоступенчатой выборки многофазная выборка предполагает сохранение одной и той же единицы отбора на всех этапах его проведения, при этом отобранные на каждой стадии единицы подвергаются обследованию (на каждой последующей стадии программа обследования расширяется).
Для начала введем некоторые характеристики генеральной и выборочной совокупностей:
№ п/п | Характеристика | Генеральная совокупность | Выборочная совокупность |
1. | Объём совокупности | N | n |
2. | Численность единиц, обладающих обследуемым признаком | M | m |
3. | Доля единиц, обладающих обследуемым признаком | ||
4. | Средний размер признака | = | = |
5. | Дисперсия количественного признака | = | = |
6. | Дисперсия доли | = | =w(1-w) |
Существует два вида ошибок: ошибка регистрации и репрезентативности. Ошибка регистрации носит случайный или систематический характер и избегается путем правильной организации и проведения наблюдения. Ошибка репрезентативности органически присуща выборочному методу, так как выборочная совокупность не полностью воспроизводит генеральную совокупность. Выборочный метод опирается на теорию вероятностей и пользуется её методами, которые основаны на использование предельной теоремы закона больших чисел, и пользуясь этими методами можно свести к минимуму ошибки репрезентативности.
Ошибка выборочного наблюдения – это разность между величиной параметра в генеральной совокупности и его величиной, вычисленной по результатам выборочного наблюдения. То есть, вычисляя ошибку выборки, исследователь определяет вероятные пределы, в которых может находиться искомая характеристика генеральной совокупности. Для среднего значения ошибка будет определяться следующим образом:
,
где , .
Величина называется предельной ошибкой выборки.
Предельная ошибка выборки величина случайная. Наиболее полно закономерности случайных ошибок выборки раскрыты в теоремах П.Л. Чебышева и А.М. Ляпунова.
Теорему Чебышева применительно к определению среднего значения можно сформулировать следующим образом: при достаточно большом числе независимых наблюдений можно с вероятностью, близкой к единице, утверждать, что отклонение выборочной средней от генеральной будет сколь угодно малым. В теореме доказано, что величина ошибки не должна превышать tμ.
где , (3.1)
μ также зависит от способа отбора из генеральной совокупности.
Величину называют средней ошибкой выборки и обозначают μ, σ² - генеральная дисперсия, n – объём выборочной совокупности.
Из формулы (3.1) видно, что существует обратная связь между средней ошибкой выборки и числом отобранных единиц. Причем это не только просто обратная математическая зависимость, а такая зависимость, которая показывает. Что квадрат расхождения между средними обратно пропорционален числу отобранных единиц.
Далее посмотрим, как влияет колеблемость признака в генеральной совокупности на величину ошибки. Увеличение колеблемости признака повлечет за собой увеличение среднего квадратического отклонения, а значит и ошибки. Но чаще всего величина колеблемости признака в генеральной совокупности бывает неизвестна, поскольку неизвестны размеры единиц совокупности. то есть можно рассчитать лишь величину колеблемости признака в выборочной совокупности. соотношение между дисперсиями генеральной и выборочной совокупности выражается формулой
Так как величина при достаточно больших n близка к 1, то можно приближенно считать, что .
Следовательно, средняя ошибка выборки показывает, какие возможны отклонения характеристик выборочной совокупности от соответствующих характеристик генеральной совокупности. Но о величине этой ошибки можно судить с определенной вероятностью. На величину вероятности указывает множитель t.
А.М. Ляпунов доказал, что распределение выборочных средних (а значит, и их отклонений от генеральной средней) при достаточно большом числе независимых наблюдений приближенно нормально при условии, что генеральная совокупность обладает конечной средней и ограниченной дисперсией.
Математически теорему Ляпунова можно записать так:
где - предельная ошибка выборки, которая дает возможность судить, в каких пределах находится величина генеральной средней.
Значения этого интеграла для различных значений коэффициента доверия t вычислены и приводятся в специальных математических таблицах. Например, при t=1, F(t)=0.6827, т.е. с вероятностью 0,6827 можно утверждать, что разность между генеральной и выборочной средними не превышает одной величины средней ошибки. Логически связь здесь выглядит довольно ясно: чем больше пределы, в которых допускается возможная ошибка, тем с большей вероятностью судят о ее величине.
Зная выборочную среднюю величину признака () и предельную ошибку выборки (), можно определить пределы, в которых заключена генеральная средняя:
или
Теорема Бернулли была доказана раньше теоремы Чебышева – Ляпунова, но является лишь её частным случаем, рассматривая ошибку выборки для альтернативного признака.
В ней утверждается, что при достаточно большом объёме выборки вероятность расхождения между долей признака в выборочной совокупности (w) и долей признака в генеральной совокупности (p) будет стремиться к единице.
Математически это выглядит так
Ввиду того, что вероятность расхождения между частостью и долей следует закону нормального распределения, эту вероятность можно найти по функции F(t) в зависимости от задаваемой величины t.
Следовательно, также как и в расхождениях средних, величина расхождения между долей признака в выборочной совокупности и долей признака в генеральной совокупности зависит от средней ошибки выборки. Эта зависимость выражается следующей формулой:
,
где (q = 1-p) - среднее квадратическое отклонение в генеральной совокупности для альтернативного признака. Но, так как доля признака в выборочной совокупности неизвестна, приходиться выразить её через долю того же признака в генеральной совокупности, т.е. принять , а дисперсию альтернативного признака принять за w(1 – w), тогда средняя ошибка выборки выразится формулой
Предельная величина разности между частостью и долей называется предельной ошибкой выборки. О величине предельной ошибки можно судить с некоторой вероятностью, зависящей от множителя t, так как .
Если известна доля признака (w) и предельная ошибка выборки (), то можно определить границы, в которых заключена генеральная доля (р):
Если отбор единиц из генеральной совокупности производился бесповторным способом, то речь уже идет о зависимых событиях, осуществляющихся с условными вероятностями, т.е. здесь уже нельзя использовать формулу средней ошибки при случайной повторной выборки. Существует более общая формула средней ошибки выборки, которая имеет следующий вид:
,
где - средний коэффициент корреляции, выражающий взаимосвязь между единицами возможных при данных условиях отбора выборочных совокупностей. Его называют внутригрупповым (или внутриклассовым) коэффициентом корреляции. При повторном случайном отборе он равен 0, так как связь между единицами совокупности отсутствует. При бесповторном отборе предполагается наличие взаимосвязи между единицами выборочной совокупности, и коэффициент корреляции нужно учитывать. Этот коэффициент в случайном бесповторном отборе имеет вид: . Подстановка в общую формулу средней ошибки коэффициента внутригрупповой корреляции даёт следующий результат:
Эту формулу иногда упрощают, заменяя выражением . Т.е. формула средней ошибки случайного бесповторного отбора принимает вид:
Если отбросить указанный множитель, что часто делается на практике, то получается некоторое преувеличение средней ошибки, что делает выводы более надежными. Однако при различных формах направленного отбора нельзя пренебрегать коэффициентом внутригрупповой корреляции.
Результаты выборочного статистического исследования во многом зависят от уровня подготовки процесса наблюдения. Под уровнем подготовки в данном случае подразумевается соблюдение определенных правил и принципов проектирования выборочного обследования. Важнейшим элементом проектирования выборочного обследования является составление организационного плана выборочного наблюдения. В общем виде организационный план выглядит следующим образом:
1. Постановка цели и задач наблюдения.
2. Определение границ объекта исследования.
3. Обработка программы наблюдения (составление анкеты, опросного листа, формы отчета и т.д.) и разработка её материалов.
4. Определение процедуры отбора, способа отбора и объёма выборки.
5. Подготовка кадров для проведения наблюдения, размножение формуляров, инструктивных документов.
6. Расчет выборочных характеристик и определение ошибок выборки.
7. Распространение выборочных данных на всю совокупность.
При проектирование выборочного наблюдения встает вопрос о необходимой численности выборки.
Для определения необходимого объёма выборки задается уровень точности выборочной совокупности с определенной вероятностью. Например, необходимая численность случайной повторной выборки определяется по формуле
,
которая вытекает из формулы предельной ошибки: .
Эта формула показывает, что при увеличении предполагаемой ошибки выборки значительно уменьшается необходимый объём выборки. Необходимая численность выборки прямо пропорциональна дисперсии признака и величине t2. Формула необходимого объёма выборки выводится для разных способов отбора из формулы предельной ошибки выборки. В таблице 4.1 приведены формулы необходимого объёма выборки для некоторых способов формирования выборочной совокупности.
Таблица 4.1[*]
Вид выборочного наблюдения | Повторный отбор | Бесповторный отбор |
Собственно-случайная выборка: a) при определении среднего размера признака
б) при определении доли признака
Механическая выборка
Типическая выборка:
а) при определении среднего размера выборки
б) при определении доли признака
Серийная выборка:
а) при определении среднего размера выборки
б) при определении доли признака |
|
|
Информация о работе Выборочный метод и его применение в социально-экономической статистике