Проверка статистических гипотез

Автор работы: Пользователь скрыл имя, 29 Ноября 2011 в 23:58, курсовая работа

Краткое описание

Математическая теория проверки гипотез, в которой критерии появляются как решения точно поставленных оптимальных проблем, была создана Ю. Нейманом и Э. Пирсоном в 30-х годах XX века и с тех пор получила значительное развитие. Статистическая гипотеза – это определённое предположение о распределении вероятностей, лежащем в основе наблюдаемой выборки данных. Проверка статистической гипотезы – это процесс принятия решения о том, противоречит ли рассматриваемая статистическая гипотеза наблюдаемой выборке данных.

Содержание работы

Введение. 2
Глава 1. Основные понятия теории проверки статистических гипотез. 3
§1. Статистическая гипотеза. Статистические критерии. 3
§2. Критическая область и критические точки. 4
§3. Дополнительные сведения о выборе критической области. 8
Глава 2. Проверка некоторых статистических гипотез. 10
§1. Сравнение двух дисперсий нормальных генеральных совокупностей. 10
§2. Критерий согласия Пирсона. 12
§3. Проверка псевдослучайных последовательностей. 15
Заключение. 17
Список литературы. 18

Содержимое работы - 1 файл

курсовая работа Дерябин Максим.doc

— 280.50 Кб (Скачать файл)

     Мы  строили критическую область, исходя из требования, чтобы вероятность попадания в нее критерия была равна , при условии, что нулевая гипотеза справедлива. Однако оказывается целесообразным ввести в рассмотрение вероятность попадания критерия в критическую область при условии, что нулевая гипотеза неверна и, следовательно, справедлива конкурирующая.

     Мощностью критерия называют вероятность попадания критерия в критическую область, при условии, что справедлива конкурирующая гипотеза. Другими словами, мощность критерия есть вероятность того, что нулевая гипотеза будет отвергнута, если верна конкурирующая гипотеза.

     Пусть для проверки гипотезы принят определенный уровень значимости и выборка имеет фиксированный объем. Остается произвол в выборе критической области. Покажем, что ее целесообразно построить так, чтобы мощность критерия была максимальной.

     Убедимся, что если вероятность ошибки второго рода (принять неправильную гипотезу) равна , то мощность равна . Действительно, если – вероятность ошибки второго рода, т. е. события «принята нулевая гипотеза, причем справедлива конкурирующая», то вероятность противоположного события «отвергнута нулевая гипотеза, причем справедлива конкурирующая», т. е. мощность критерия, равна .

     Пусть мощность возрастает; следовательно, уменьшается вероятность совершить ошибку второго рода. Таким образом, чем мощность больше, тем вероятность ошибки второго рода меньше.

     Таким образом, если уровень значимости уже выбран, то критическую область следует строить так, чтобы мощность критерия была максимальной. Выполнение этого требования обеспечит минимальную ошибку второго рода.

     Поскольку вероятность события «ошибка  второго рода допущена» равна , то вероятность противоположного события «ошибка второго рода не допущена» равна , т. е. мощности критерия. Отсюда Следует, что мощность критерия есть вероятность того, что не будет допущена ошибка второго рода.

     Ясно, что чем меньше вероятности ошибок первого и второго рода, тем критическая область «лучше». Однако, при заданном объеме выборки, уменьшить одновременно и невозможно: если уменьшать , то будет возрастать. Единственный способ одновременного уменьшения вероятностей ошибок первого и второго рода состоит в увеличении объема выборок. 

 

Глава 2.  
Проверка некоторых статистических гипотез.
 

     §1. Сравнение двух дисперсий нормальных генеральных совокупностей. 

     На  практике задача сравнения дисперсий  возникает, если требуется сравнить точность приборов, инструментов, самих методов измерений и т. д. Очевидно, предпочтительнее тот прибор, инструмент и метод, который обеспечивает наименьшее рассеяние результатов измерений, т. е. наименьшую дисперсию.

     Пусть генеральные совокупности X и Y распределены нормально. По независимым выборкам объемов n1 и n2 извлеченным из этих совокупностей, найдены исправленные выборочные дисперсии и . Требуется по исправленным дисперсиям, при заданном уровне значимости а, проверить нулевую гипотезу, состоящую в том, что генеральные дисперсии рассматриваемых совокупностей равны между собой:

.

Учитывая, что исправленные дисперсии являются несмещенными оценками генеральных дисперсий, то есть что и , нулевую гипотезу можно записать так:

.

     Таким образом, требуется проверить, что математические ожидания исправленных выборочных дисперсий равны между собой. Такая задача ставится потому, что обычно исправленные дисперсии оказываются различными. Возникает вопрос: значимо (существенно) или значимо, различаются исправленные дисперсии?

     Если  окажется, что нулевая гипотеза справедлива, т. е. генеральные дисперсии одинаковы, то различие исправленных дисперсий незначимо и объясняется случайными причинами, в частности, случайным отбором объектов выборки. Например, если различие исправленных выборочных дисперсий результатов измерений, выполненных двумя приборами, оказалось незначимым, то приборы имеют одинаковую точность.

     Если  нулевая гипотеза будет отвергнута, т. е. генеральные дисперсии неодинаковы, то различие исправленных дисперсий значимо и ие может быть объяснено случайными причинами, а является следствием того, что сами генеральные дисперсии различны. Например, если различие исправленных выборочных дисперсий результатов измерений, произведенных двумя приборами, оказалось значимым, то точность приборов различна.

     В качестве критерия проверки нулевой гипотезы о равенстве генеральных дисперсий, примем отношение большей исправленной дисперсии к меньшей, т. е. случайную величину

     

.

     Величина  F, при условии справедливости нулевой гипотезы имеет распределение Фишера-Снедекора со степенями свободы и , где n1 – объем выборки, по которой вычислена большая исправленная дисперсия, n2 объем выборки, по которой найдена меньшая дисперсия. Критическая область строится в зависимости от вида конкурирующей гипотезы. Пусть для определенности нулевая гипотеза , конкурирующая – . В этом случае строят одностороннюю, а именно правостороннюю, критическую область, исходя из требования, чтобы вероятность попадания критерия F в эту область, в предположении справедливости нулевой гипотезы, была равна принятому уровню значимости:

.

Критическую точку  находят по таблице критических точек распределения Фишера–Снедекора.

     Если  же нулевая гипотеза имеет вид  , а конкурирующая – , то строят двустороннюю критическую область, исходя из требования, чтобы вероятность попадания критерия в эту область, в предположении справедливости нулевой гипотезы, была равна принятому уровню значимости . 

     §2. Критерий согласия Пирсона. 

     Если  закон распределения неизвестен, но есть основания предположить, что он имеет определенный вид (назовем его А), то проверяют нулевую гипотезу: генеральная совокупность распределена по закону А.

     Проверка  гипотезы о предполагаемом законе неизвестного распределения производится так же, как и проверка гипотезы о параметрах распределения, т. е. при помощи специально подобранной случайной величины – критерия согласия. Критерием согласия называют критерий проверки гипотезы о предполагаемом законе неизвестного распределения.

     Имеется несколько критериев согласия: («хи квадрат») К. Пирсона, Колмогорова, Смирнова и др. Опишем применение критерия Пирсона к проверке гипотезы о нормальном распределении генеральной совокупности (критерий аналогично применяется и для других распределений, в этом состоит его достоинство). С этой целью будем сравнивать эмпирические (наблюдаемые) и теоретические (вычисленные в предположении нормального распределения) частоты. Обычно эмпирические и теоретические частоты различаются.

     Критерий  Пирсона отвечает на поставленный выше вопрос. Правда, как и любой критерий, он не доказывает справедливость гипотезы, а лишь устанавливает, на принятом уровне значимости, ее согласие или несогласие с данными наблюдений. 

     Пусть в выборке объема получено эмпирическое распределение:

варианты xi x1 x2 xs
эмпир. частоты ni n1 n2 ns

     Допустим, что в предположении нормального распределения генеральной совокупности, вычислены теоретические частоты . При уровне значимости , требуется проверить нулевую гипотезу; генеральная совокупность распределена нормально.

     В качестве критерия проверки нулевой  гипотезы примем случайную величину

 
.
(2)

Эта величина случайная, гак как в различных  опытах она принимает различные, заранее неизвестные значения. Ясно, что чем меньше различаются эмпирические и теоретические частоты, тем меньше величина критерия (2) и, следовательно, он в известной степени характеризует близость эмпирического и теоретического распределений.

     Заметим, что возведением в квадрат  разностей частот устраняют возможность взаимного погашения положительных и отрицательных разностей. Делением на достигают уменьшения каждого из слагаемых; в противном случае сумма была бы настолько велика, что приводила бы к отклонению нулевой гипотезы даже и тогда, когда она справедлива. Разумеется, приведенные соображения не являются обоснованием выбранного критерия, а лишь пояснением.

     Доказано, что при закон распределения случайной величины (2), независимо от того, какому закону распределения подчинена генеральная совокупность, стремится к закону распределения с k степенями свободы. Поэтому случайная величина (2) обозначена через , а сам критерий называют критерием согласия «хи квадрат». Число степеней свободы находят по равенству , где s – число групп (частичных интервалов) выборки, r – число параметров предполагаемого распределения, которые оценены по данным выборки.

     В частности, если предполагаемое распределение – нормальное, то оценивают два параметра (математическое ожидание и среднее квадратическое отклонение) поэтому и число степеней свободы . Если, например, предполагают, что генеральная cовокупность распределена по закону Пуассона, то оценивают один параметр , поэтому и .

     Поскольку односторонний критерий более «жестко» отвергает нулевую гипотезу, чем  двусторонний, построим правостороннюю критическую область, исходя из требования, чтобы вероятность попадания критерия в эту область, в предположении справедливости нулевой гипотезы, была равна принятому уровню значимости :

.

     Таким образом, правосторонняя критическая область определяется неравенством а область принятия нулевой гипотезы – неравенством . Обозначим значение критерия, вычисленное по данным наблюдений, через и сформулируем правило проверки нулевой гипотезы.

     Правило. Для того чтобы, при заданном уровне значимости, проверить нулевую гипотезу H0: генеральная совокупность распределена нормально, надо сначала вычислить теоретические частоты, а затем наблюдаемое значение критерия

и по таблице  критических точек распределения . по заданному уровню значимости , и числу степеней свободы , найти критическую точку . Если – нет оснований отвергнуть нулевую гипотезу. Если – нулевую гипотезу отвергают. 

     §3. Проверка псевдослучайных последовательностей. 

     Генератор псевдослучайных чисел – алгоритм, генерирующий последовательность чисел, элементы которой почти независимы друг от друга и подчиняются заданному распределению (обычно равномерному). Современная информатика широко использует псевдослучайные числа в самых разных приложениях – от метода Монте-Карло и имитационного моделирования до криптографии. При этом от качества используемых генераторов напрямую зависит качество получаемых результатов.

     Важным  критерием качества генератора псевдослучайных  чисел является соответствие его заданному закону распределения. Проверку данного качества вполне возможно произвести с помощью критерия Пирсона.

     Рассмотрим  для примера один из видов генераторов  псевдослучайных чисел – генератор  Фибоначчи [4]:

 
,
(3)

Информация о работе Проверка статистических гипотез