Автор работы: Пользователь скрыл имя, 08 Декабря 2011 в 01:08, лабораторная работа
Цель работы данной работы ознакомиться с процессом проверки статистических гипотез.
Поставленная цель определила задачи работы:
1. Определить сущность, понятие проверки статистических гипотез.
2. Рассмотреть этапы проверки статистических гипотез.
3. Рассмотреть критерии проверки статистических гипотез.
ВВЕДЕНИЕ 3
ТЕОРИТИЧЕСКАЯ ЧАСТЬ 4
1. Сравнение двух дисперсий нормальных генеральных совокупностей 7
2. Сравнение двух средних генеральных совокупностей 8
3. Сравнение двух вероятностей биномиальных распределений 10
4. Проверка гипотезы о значимости выборочного коэффициента корреляции 11
5. Критерий согласия Пирсона 12
ПРАКТИЧЕСКАЯ ЧАСТЬ 14
ЗАКЛЮЧЕНИЕ 18
СПИСОК ЛИТЕРАТУРЫ 19
ПРИЛОЖЕНИЕ 1 20
ПРИЛОЖЕНИЕ 2 21
ПРИЛОЖЕНИЕ 3 22
ПРИЛОЖЕНИЕ 4 23
Федеральное
государственное
ФИНАНСОВЫЙ
УНИВЕРСИТЕТ ПРИ ПРАВИТЕЛЬСТВЕ РОССИЙСКОЙ
ФЕДЕРАЦИИ
Кафедра
«статистика»
Лабораторная
работа
По теме:
«Статистическая
проверка гипотез»
Москва 2011
Оглавление
ВВЕДЕНИЕ 3
ТЕОРИТИЧЕСКАЯ ЧАСТЬ 4
1. Сравнение двух дисперсий нормальных генеральных совокупностей 7
2. Сравнение двух средних генеральных совокупностей 8
3. Сравнение двух вероятностей биномиальных распределений 10
4. Проверка гипотезы о значимости выборочного коэффициента корреляции 11
5. Критерий согласия Пирсона 12
ПРАКТИЧЕСКАЯ ЧАСТЬ 14
ЗАКЛЮЧЕНИЕ 18
СПИСОК ЛИТЕРАТУРЫ 19
ПРИЛОЖЕНИЕ 1 20
ПРИЛОЖЕНИЕ 2 21
ПРИЛОЖЕНИЕ 3 22
ПРИЛОЖЕНИЕ 4 23
Статистическая проверка гипотез проводится с помощью некоторого статистического критерия по общей логической схеме, включающей нахождение конкретного вида функции от результатов наблюдения (критической статистики), на основании которой принимается окончательное решение. Например, могут рассматриваться гипотезы об общем законе распределения исследуемой случайной величины, об однородности двух или нескольких обрабатываемых выборок, о числовых значениях параметров исследуемой генеральной совокупности и др. Результат проверки может быть либо отрицательным (данные наблюдения противоречат высказанной гипотезе), либо неотрицательным. В первом случае гипотеза ошибочна, во втором – ее нельзя считать доказанной: просто она не противоречит имеющимся выборочным данным, однако таким же свойством могут наряду с ней обладать и другие гипотезы. Для статистической проверки гипотез используются разные критерии, например, критерий Пирсона χ2 , критерий Колмогорова-Смирнова и др.
Цель работы данной работы ознакомиться с процессом проверки статистических гипотез.
Поставленная цель определила задачи работы:
1. Определить сущность, понятие проверки статистических гипотез.
2.
Рассмотреть этапы проверки
3. Рассмотреть критерии проверки статистических гипотез.
4. Ознакомиться на примерах с проверками различных статистических гипотез.
ТЕОРИТИЧЕСКАЯ ЧАСТЬ
В процессе статистического анализа иногда бывает необходимо сформулировать и проверить предположения (гипотезы) относительно величины независимых параметров или закона распределения изучаемой совокупности.
Статистическая гипотеза представляет собой некоторое предположение о законе распределения случайной величины или о параметрах этого закона, которые можно проверить, опираясь на результаты наблюдений в случайной выборке.
Сопоставление
высказанной гипотезы относительно
генеральной совокупности с имеющимися
выборочными данными с оценкой
степени достоверности
Смысл проверки статистической гипотезы состоит в том, чтобы по имеющимся статистическим данным принять или отклонить статистическую гипотезу с минимальным риском ошибки. Эта проверка осуществляется по определенным правилам.
Следует иметь в виду, что статистическая проверка гипотез имеет вероятностный характер. С помощью статистической проверки гипотез можно определить вероятность принятия ложного решения по тем или иным результатам статистического изучения данного явления. Если вероятность ошибки невелика, то статистические показатели, полученные при изучении явления, могут быть использованы для применения на практике.
Гипотезы классифицируются на:
Если выдвигаемая гипотеза сводится к утверждению о том, что значение некоторого неизвестного параметра генеральной совокупности в точности равно заданной величине, то эта гипотеза называется простой. Сложной называют гипотезу, которая состоит из конечного или бесконечного множества простых гипотез, при этом указывается некоторая область вероятных значений параметра.
Гипотезы, в основе которых нет никаких допущений о конкретном виде закона распределения, называют непараметрическими, в противном случае – параметрическими. Другими словами, гипотезы о параметрах совокупности называются параметрическими, о распределениях - непараметрическими.
Гипотезу, утверждающую, что различие между сравниваемыми характеристиками отсутствует, а наблюдаемые отклонения объясняются лишь случайными колебаниями в выборках, на основании которых производится сравнение, называют нулевой (основной) гипотезой и обозначают Н0. Наряду с основной гипотезой рассматривают и альтернативную (конкурирующую, противоречащую) ей гипотезу Н1. И если нулевая гипотеза будет отвергнута, то будет иметь место альтернативная гипотеза. В качестве нулевой гипотезы Н0 принято выдвигать простую гипотезу, так как обычно бывает удобнее проверять более строгое утверждение.
Принятие или отклонение гипотезы Н0 по случайной выборке соответствует истине с некоторой вероятностью и, соответственно, возможны два рода ошибок. Ошибка первого рода возникает, когда отвергается верная гипотеза Н0 и принимается конкурирующая гипотеза Н1. Вероятность ошибки первого рода принято обозначать a, она называется уровнем значимости критерия. Обычно a выбирают равными 0,1; 0.05; 0.025 и 0,01. Ошибка второго рода возникает в том случае, когда принимается неверная гипотеза Н0, в то время как справедлива конкурирующая гипотеза Н1. Вероятность ошибки второго рода обозначается b.
Доверительная вероятность – это вероятность не совершить ошибку первого рода и принять верную гипотезу Н0. Вероятность отвергнуть ложную гипотезу Н0 называется мощностью критерия. Следовательно, при проверке гипотезы возможны четыре варианта исходов представленные в таблице ниже.
Гипотеза Н0 | Решение | Вероятность | |
Верна | Принимается | 1–a | Доверительная вероятность |
Отвергается | a | Вероятность ошибки первого рода | |
Неверна | Принимается | b | Вероятность ошибки второго рода |
Отвергается | 1–b | Мощность критерия |
Для проверки статистической гипотезы используется специально подобранная случайная величина К с известным законом распределения, называемая статистическим критерием. Множество ее возможных значений разбивается на два непересекающихся подмножества: одно из них (критическая область) содержит значения критерия, при которых нулевая гипотеза отклоняется, второе (область принятия гипотезы) – значения К, при которых она принимается. Значения К, отделяющие критическую область от области принятия гипотезы, называются критическими точками kр. Критическая область может быть правосторонней (если она задается неравенством ), левосторонней ( ) или двусторонней ( ). Для ее нахождения нужно задать вероятность ошибки первого рода α,тогда, например, правосторонняя критическая область задается условием .
Порядок проверки статистической гипотезы таков:
Рассмотрим
способы проверки некоторых статистических
гипотез.
Пусть имеются две выборки объемов п1 и п2, извлеченные из нормально распределенных генеральных совокупностей Х и Y. Требуется по исправленным выборочным дисперсиям и проверить нулевую гипотезу о равенстве генеральных дисперсий рассматриваемых генеральных совокупностей:
Критерием служит случайная величина отношение большей исправленной дисперсии к меньшей, которая при условии справедливости нулевой гипотезы имеет распределение Фишера-Снедекора со степенями свободы k1 = n1 – 1 и k2 = n2 – 1. Критическая область зависит от вида конкурирующей гипотезы:
если H1: D (X) > D (Y), то критическая область правосторонняя:
Критическая точка находится по таблице критических точек распределения Фишера-Снедекора. Если нулевая гипотеза принимается, в противном случае – отвергается.
2)
При конкурирующей гипотезе H1:
D (X) ≠ D (Y) критическая область двусторонняя:
При этом достаточно найти
Тогда, если
нет оснований отвергнуть нулевую
гипотезу, если
нулевую гипотезу отвергают.
2. Сравнение двух средних генеральных совокупностей
1) Генеральные совокупности Х и Y распределены нормально, причем известны их дисперсии. Из этих генеральных совокупностей извлечены выборки объемов соответственно т и п, для которых найдены выборочные средние и . При заданном уровне значимости α проверяется нулевая гипотеза о равенстве математических ожиданий генеральных совокупностей:
Статистическим критерием для проверки этой гипотезы является нормированная нормально распределенная случайная величина
Наблюдаемое значение критерия . Вид критической области зависит от типа конкурирующей гипотезы: