Автор работы: Пользователь скрыл имя, 29 Ноября 2011 в 23:58, курсовая работа
Математическая теория проверки гипотез, в которой критерии появляются как решения точно поставленных оптимальных проблем, была создана Ю. Нейманом и Э. Пирсоном в 30-х годах XX века и с тех пор получила значительное развитие. Статистическая гипотеза – это определённое предположение о распределении вероятностей, лежащем в основе наблюдаемой выборки данных. Проверка статистической гипотезы – это процесс принятия решения о том, противоречит ли рассматриваемая статистическая гипотеза наблюдаемой выборке данных.
Введение. 2
Глава 1. Основные понятия теории проверки статистических гипотез. 3
§1. Статистическая гипотеза. Статистические критерии. 3
§2. Критическая область и критические точки. 4
§3. Дополнительные сведения о выборе критической области. 8
Глава 2. Проверка некоторых статистических гипотез. 10
§1. Сравнение двух дисперсий нормальных генеральных совокупностей. 10
§2. Критерий согласия Пирсона. 12
§3. Проверка псевдослучайных последовательностей. 15
Заключение. 17
Список литературы. 18
Федеральное агентство по образованию Российской Федерации
Ставропольский Государственный Университет
Кафедра
математического анализа
Курсовая работа
на тему:
«Проверка
статистических гипотез»
Выполнил
студент 4 курса ФМФ
очной формы обучения
специальность математика группа А
Дерябин
Максим
Ставрополь,
2011 г.
Содержание.
Введение.
Математическая теория проверки гипотез, в которой критерии появляются как решения точно поставленных оптимальных проблем, была создана Ю. Нейманом и Э. Пирсоном в 30-х годах XX века и с тех пор получила значительное развитие. Статистическая гипотеза – это определённое предположение о распределении вероятностей, лежащем в основе наблюдаемой выборки данных. Проверка статистической гипотезы – это процесс принятия решения о том, противоречит ли рассматриваемая статистическая гипотеза наблюдаемой выборке данных.
Статистическая
проверка гипотез является одним из
важнейших разделов математической статистики.
Методы математической статистики позволяют
проверить предположения о законе распределения
некоторой случайной величины (генеральной
совокупности), о значениях параметров
этого закона, о наличии корреляционной
зависимости между случайными величинами,
определенными на множестве объектов
одной и той же генеральной совокупности.
Пусть по некоторым данным имеются основания
выдвинуть предположения о законе распределения
или о параметре закона распределения
случайной величины (или генеральной совокупности,
на множестве объектов которой определена
эта случайная величина). Задача заключается
в том, чтобы подтвердить или опровергнуть
это предположение, используя выборочные
(экспериментальные) данные. Гипотезы
о значениях параметров распределения
или о сравнительной величине параметров
двух распределений называются параметрическими
гипотезами.
Глава 1.
Основные понятия теории
проверки статистических
гипотез.
§1.
Статистическая гипотеза.
Статистические критерии.
Часто необходимо знать закон распределения генеральной совокупности. Если закон распределения неизвестен, но имеются основания предположить, что он имеет определенный вид A, выдвигается гипотеза: генеральная совокупность распределена по закону A. Таким образом, в этой гипотезе речь идет о виде предполагаемого распределения.
Возможен случай, когда закон распределения известен, а его параметры неизвестны. Если есть основания предположить, что неизвестный параметр b равен определенному значению b0, выдвигают гипотезу: b = b0. Таким образом, в этой гипотезе речь идет о предполагаемой величине параметра одного известного распределения.
Возможны и другие гипотезы: о равенстве параметров двух или нескольких распределений, о независимости выборок и многие другие.
Статистической называют гипотезу о виде неизвестного распределения, или о параметрах известных распределении.
Наряду с выдвинутой гипотезой рассматривают и противоречащую ей гипотезу. Если выдвинутая гипотеза будет отвергнута, то имеет место противоречащая гипотеза. По этой причине эти гипотезы целесообразно различать. Нулевой (основной) называют выдвинутую гипотезу H0. Конкурирующей (альтернативной) называют гипотезу H1, которая противоречит нулевой.
Простой называют гипотезу, содержащую только одно предположение. Сложной называют гипотезу, которая состоит из конечного или бесконечного числа простых гипотез.
Выдвинутая гипотеза может быть правильной или неправильной, поэтому возникает необходимость ее проверки. Поскольку проверку производят статистическими методами, ее называют статистической. В итоге статистической проверки гипотезы в двух случаях может быть принято неправильное решение, т. е. могут быть допущены ошибки двух родов:
Подчеркнем, что последствия этих ошибок могут оказаться весьма различными.
Таким образом, правильное решение может быть принято также в двух случаях:
Вероятность совершить ошибку первого рода принято обозначать через ; ее называют уровнем значимости. Наиболее часто уровень значимости принимают равным 0,05 или 0,01. Если, например, принят уровень значимости равный 0,05, то это означает, что в пяти случаях из ста есть риск допустить ошибку первого рода (отвергнуть правильную гипотезу).
Для
проверки нулевой гипотезы используют
специально подобранную случайную величину,
точное или приближенное распределение
которой известно. Статистическим критерием
(или просто критерием) называют случайную
величину K, которая служит для проверки
нулевой гипотезы. Для проверки гипотезы
по данным выборок вычисляют частные значения
входящих в критерий величин, и таким образом
получают частное (наблюдаемое) значение
критерия. Наблюдаемым значением Kнабл
назначают значение критерия, вычисленное
по выборкам.
§2.
Критическая область
и критические точки.
После выбора определенного критерия, множество всех его возможных значений разбивают на два непересекающихся подмножества: одно из них содержит значения критерия, при которых нулевая гипотеза отвергается, а другое – при которых она принимается.
Критической областью называют совокупность значений критерия, при которых нулевую гипотезу отвергают. Областью принятия гипотезы (областью допустимых значений) называют совокупность значений критерия, при которых гипотезу принимают.
Основной принцип проверки статистических гипотез можно сформулировать так: если наблюдаемое значение критерия принадлежит критической области – гипотезу отвергают, если наблюдаемое значение критерия принадлежит области принятия гипотезы – гипотезу принимают.
Поскольку критерий K, введенный в прошлом пункте, – одномерная случайная величина, все ее возможные значения принадлежат некоторому интервалу. Поэтому критическая область и область принятия гипотезы также являются интервалами и, следовательно, существуют точки, которые их разделяют.
Критическими точками (границами) kкр называют точки, отделяющие критическую область от области принятия гипотезы. Различают одностороннюю (правостороннюю или левостороннюю) и двустороннюю критические области.
Правосторонней называют критическую область, определяемую неравенством K > kкр, где kкр – положительное число. Левосторонней называют критическую область, определяемую неравенством K < kкр, где kкр – отрицательное число. Односторонней называют правостороннюю или левостороннюю критическую область. Двусторонней называют критическую область, определяемую неравенствами K < k1, K > k2, где k2 > k1.
Для определенности начнем с нахождения правосторонней критической области, которая определяется неравенством
kкр > 0. Видно, что для отыскания правосторонней критической области достаточно найти критическую точку.
С этой целью задаются достаточно малой вероятностью – уровнем значимости . Затем ищут критическую точку kкр, исходя из требования, чтобы, при условии справедливости нулевой гипотезы, вероятность того, что критерий К примет значение, большее kкр, была равна принятому уровню значимости:
(1) |
Для каждого критерия имеются соответствующие таблицы, по которым и находят критическую точку, удовлетворяющую этому требованию. Когда критическая точка уже найдена, вычисляют по данным выборок наблюденное значение критерия и, если окажется, что Kнабл > kкр, то нулевую гипотезу отвергают, Kнабл < kкр, то нет оснований, чтобы отвергнуть нулевую гипотезу.
Данное правило вытекает из того, что вероятность события K > kкр мала ( – малая вероятность), такое событие, при справедливости нулевой гипотезы, в силу принципа практической невозможности маловероятных событий, в единичном испытании не должно наступить [1]. Если все же оно произошло, т. е. наблюдаемое значение критерия оказалось больше kкр, то это можно объяснить тем, что нулевая гипотеза ложна и, следовательно, должна быть отвергнута. Таким образом, требование (1) определяет такие значения критерия, при которых нулевая гипотеза отвергается, а они и составляют правостороннюю критическую область.
Наблюдаемое значение критерия может оказаться большим kкр не потому, что нулевая гипотеза ложна, а по другим причинам (малый объем выборки, недостатки методики эксперимента и др.). В этом случае, отвергнув правильную нулевую гипотезу, совершают ошибку первого рода. Вероятность этой ошибки равна уровню значимости .
Пусть нулевая гипотеза принята; ошибочно думать, что тем самым она доказана. Действительно, известно, что один пример, подтверждающий справедливость некоторого общего утверждения еще не доказывает его. Поэтому считается, что в этом случае данные наблюдений согласуются с нулевой гипотезой и, следовательно, не дают оснований ее отвергнуть.
На практике для большей уверенности принятия гипотезы, ее проверяют другими способами, или повторяют эксперимент, увеличив объем выборки.
Отвергают гипотезу более категорично, чем принимают. Действительно, известно, что достаточно привести один пример, противоречащий некоторому общему утверждению, чтобы это утверждение отвергнуть. Если оказалось, что наблюдаемое значение критерия принадлежит критической области, то этот факт и служит примером, противоречащим нулевой гипотезе, что позволяет ее отклонить.
Отыскание левосторонней и двусторонней критических областей сводится (так же, как и для правосторонней) к нахождению соответствующих критических точек. Левосторонняя критическая область определяется неравенством , kкр < 0. Критическую точку находят, исходя из требования, чтобы при справедливости нулевой гипотезы, вероятность того, что критерий примет значение, меньшее kкр, была равна принятому уровню значимости:
Двусторонняя
критическая область
Ясно, что в данном случае критические точки могут быть выбраны бесчисленным множеством способов.
Если же распределение критерия симметрично относительно нуля и имеются основания выбрать симметричные относительно нуля точки –kкр и kкр (kкр > 0), то
и, следовательно,
Критические
точки находят по соответствующим таблицам.
§3.
Дополнительные сведения
о выборе критической
области.