Автор работы: Пользователь скрыл имя, 05 Марта 2013 в 00:01, реферат
Широкое распространение методики фиксированного уровня значимости было вызвано сложностью вычисления многих статистических критериев в докомпьютерную эпоху. Чаще всего использовались таблицы, в которых для некоторых априорных уровней значимости были выписаны критические значения. В настоящее время результаты проверки гипотез чаще представляют с помощью достигаемого уровня значимости.
Методика проверки статистических гипотез 3
Альтернативная методика на основе достигаемого уровня значимости 4
Типы критической области 4
Ошибки первого и второго рода 5
Свойства статистических критериев 6
Типы статистических гипотез 6
Типы статистических критериев 6
Критерии согласия 7
Критерии сдвига 7
Критерии нормальности 7
Критерии однородности 8
Критерии симметричности 8
Критерии тренда, стационарности и случайности 8
Литература 9
Міністерство освіти і науки, молоді та спорту України
Національний авіаційний університет
Інститут комп’ютерних інформаційних технологій
Доповідь
з дисципліни «Методи та засоби обробки інформації в системах контролю»
на тему: «Помилки першого та другого роду статистичних гіпотез»
Виконав:
студент групи IKIT-512
Стасюк І.С.
Прийняла:асистент
Холявкіна Т.В.
Київ 2013
Оглавление
Методика проверки статистических гипотез 3
Альтернативная методика на основе достигаемого уровня значимости 4
Типы критической области 4
Ошибки первого и второго рода 5
Свойства статистических критериев 6
Типы статистических гипотез 6
Типы статистических критериев 6
Критерии согласия 7
Критерии сдвига 7
Критерии нормальности 7
Критерии однородности 8
Критерии симметричности 8
Критерии тренда, стационарности и случайности 8
Литература 9
Пусть задана случайная выборка — последовательность объектов из множества . Предполагается, что на множестве существует некоторая неизвестная вероятностная мера .
Методика состоит в следующем.
Итак, статистический критерий определяется статистикой и критическим множеством , которое зависит от уровня значимости .
Замечание. Если данные не противоречат нулевой гипотезе, это ещё не значит, что гипотеза верна. Тому есть две причины.
Широкое распространение методики фиксированного уровня значимости было вызвано сложностью вычисления многих статистических критериев в докомпьютерную эпоху. Чаще всего использовались таблицы, в которых для некоторых априорных уровней значимости были выписаны критические значения. В настоящее время результаты проверки гипотез чаще представляют с помощью достигаемого уровня значимости.
Достигаемый уровень значимости (пи-
где — критическая область критерия.
Другая интерпретация: достигаемый уровень значимости — это вероятность при справедливости нулевой гипотезы получить значение статистики, такое же или ещё более экстремальное, чем
Если достигаемый уровень
Обозначим через значение, которое находится из уравнения , где — функция распределения статистики . Если функция распределения непрерывная строго монотонная, то есть обратная к ней функция:
.
Значение называется также -квантилем распределения .
На практике, как правило, используются статистики с унимодальной (имеющей форму пика) плотностью распределения. Критические области (наименее вероятные значения статистики) соответствуют «хвостам» этого распределения. Поэтому чаще всего возникают критические области одного из трёх типов:
определяется интервалом .
пи-величина:
определяется интервалом .
пи-величина:
определяется двумя
пи-величина:
Ошибка первого рода или «ложная тревога» (англ. type I error, error, false positive) — когда нулевая гипотеза отвергается, хотя на самом деле она верна. Вероятность ошибки первого рода:
Ошибка второго рода или «пропуск цели» (англ. type II error, error, false negative) — когда нулевая гипотеза принимается, хотя на самом деле она не верна. Вероятность ошибки второго рода:
Верная гипотеза | |||
Результат |
верно принята |
неверно принята | |
неверно отвергнута |
верно отвергнута |
Мощность критерия: — вероятность отклонить гипотезу , если на самом деле верна альтернативная гипотеза . Мощность критерия является числовой функцией от альтернативной гипотезы .
Несмещённый критерий: для всех альтернатив или, что то же самое, для всех альтернатив .
Состоятельный критерий: при для всех альтернатив .
Равномерно более мощный критерий. Говорят, что критерий с мощностью является равномерно более мощным, чем критерий с мощностью , если выполняются два условия:
для всех рассматриваемых альтернатив , причём хотя бы для одной альтернативы неравенство строгое.
Простая гипотеза однозначно определяет функцию распределения на множестве . Простые гипотезы имеют узкую область применения, ограниченную критериями согласия (см. ниже). Для простых гипотез известен общий вид равномерно более мощного критерия (Теорема Неймана-Пирсона).
Сложная гипотеза утверждает принадлежность распределения к некоторому множеству распределений на . Для сложных гипотез вывести равномерно более мощный критерий удаётся лишь в некоторых специальных случаях.
В зависимости от проверяемой нулевой гипотезы статистические критерии делятся на группы, перечисленные ниже по разделам.
Наряду с нулевой гипотезой, которая принимается или отвергается по результату анализа выборки, статистические критерии могут опираться на дополнительные предположения, которые априори предпологаются выполненными.
Параметрические критерии предполагают, что выборка порождена распределением из заданного параметрического семейства. В частности, существует много критериев, предназначенных для анализа выборок из нормального распределения. Преимущество этих критериев в том, что они более мощные. Если выборка действительно удовлетворяет дополнительным предположениям, то параметрические критерии дают более точные результаты. Однако если выборка им не удовлетворяет, то вероятность ошибок (как I, так и II рода) может резко возрасти. Прежде чем применять такие критерии, необходимо убедиться, что выборка удовлетворяет дополнительным предположениям. Гипотезы о виде распределения проверяются с помощью критериев согласия.
Непараметрические критерии не опираются на дополнительные предположения о распределении. В частности, к этому типу критериев относится большинство ранговых критериев.
Критерии согласия проверяют, согласуется ли заданная выборка с заданным фиксированным распределением, с заданным параметрическим семейством распределений, или с другой выборкой.
Специальный случай двухвыборочных критериев согласия. Проверяется гипотеза сдвига, согласно которой распределения двух выборок имеют одинаковую форму и отличаются только сдвигом на константу.
Критерии нормальности — это выделенный частный случай критериев согласия. Нормально распределённые величины часто встречаются в прикладных задачах, что обусловлено действием закона больших чисел. Если про выборки заранее известно, что они подчиняются нормальному распределению, то к ним становится возможно применять более мощные параметрические критерии. Проверка нормальность часто выполняется на первом шаге анализа выборки, чтобы решить, использовать далее параметрические методы или непараметрические. В справочнике А. И. Кобзаря приведена сравнительная таблица мощности для 21 критерия нормальности.
Критерии однородности предназначены для проверки нулевой гипотезы о том, что две выборки (или несколько) взяты из одного распределения, либо их распределения имеют одинаковые значения математического ожидания, дисперсии, или других параметров.
Критерии симметричности позволяют проверить симметричность распределения.
Критерии тренда и случайности предназначены для проверки нулевой гипотезы об отсутствии зависимости между выборочными данными и номером наблюдения в выборке. Они часто применяются в анализе временных рядов, в частности, при анализе регрессионных остатков.
Информация о работе Помилки першого та другого роду статистичних гіпотез