Параметрические методы проверки гипотез

Автор работы: Пользователь скрыл имя, 16 Ноября 2011 в 15:21, курсовая работа

Краткое описание

Задачи индуктивной статистики заключаются в том, чтобы определять, насколько вероятно, что две выборки принадлежат к одной популяции.
Давайте наложим друг на друга, с одной стороны, две кривые — до и после воздействия — для контрольной группы и, с другой стороны, две аналогичные кривые для опытной группы. При этом масштаб кривых должен быть одинаковым.

Содержание работы

Индуктивная статистика
Проверка гипотез
Параметрические методы. Метод Стьюдента (f-тест)
Степени свободы
Метод Стьюдента для зависимых выборок
Контрольная группа. Сравнение результатов для фона и после воздействия
Дисперсионный анализ (тест F Снедекора)
Непараметрические методы. Метод χ2 («хи-квадрат»)
Теоретические частоты (Т)
Критерий знаков (биномиальный критерий)
Опытная группа
Другие непараметрические критерии
Литература

Содержимое работы - 1 файл

Параметрические методы проверки гипотез.doc

— 189.00 Кб (Скачать файл)

    Если  же речь идет о двух зависимых выборках, то в основе расчета лежит вычисление суммы разностей, полученных для  каждой пары результатов (т.е., например, разностей между результатами до и после воздействия на одного и того же испытуемого). Поскольку одну (любую) из этих разностей можно вычислить, зная остальные разности и их сумму, число степеней свободы для определения критерия t будет равно n-1. 
 
 
 

  1. Метод Стьюдента для  зависимых выборок
 

    К зависимым выборкам относятся, например, результаты одной и той же группы испытуемых до и после воздействия независимой переменной. В нашем случае с помощью статистических методов для зависимых выборок можно проверить гипотезу о достоверности разницы между фоновым уровнем и уровнем после воздействия отдельно для опытной и для контрольной группы. 

    Для определения достоверности разницы  средних в случае зависимых выборок  применяется следующая формула:

 

где d —  разность между результатами в каждой паре; Sd — сумма этих частных разностей; Sd2  — сумма квадратов частных разностей. Полученные результаты сверяют с таблицей t, отыскивая в ней значения, соответствующие n-1 степени свободы; n — это в данном случае число пар данных. 

    Перед тем как использовать формулу, необходимо вычислить для каждой группы частные разности между результатами во всех парах, квадрат каждой из этих разностей, сумму этих разностей и сумму их квадратов. 

    Необходимо  произвести следующие операции: 
 
 
 
 

  1. Контрольная группа. Сравнение результатов для фона и после воздействия
Испытуемые Фон После воздействия d d2
Д1 19 21 +2 4
2 10 8 -2 4
3 12 13 +1 1
4 13 11 -2 4
5 17 20 +3 9
6 14 12 -2 4
7 17 15 -2 4
Ю1 15 17 +2 4
2 14 15 +1 1
3 15 15 - -
4 17 18 +1 1
5 15 16 +1 1
6 18 15 -3 9
7 19 19 - -
8 22 25 +3 9
Sd = +3;  Sd2 = 55
 

 

    Величина t=0,39 ниже той, которая необходима для  уровня значимости 0,05 при 14 степенях свободы. Иными словами, порог вероятности  для такого t выше 0,05. Таким образом, нулевая гипотеза не может быть отвергнута, и разница между выборками недостоверна. В сокращенном виде это записывается следующим образом: 

    t=0,39; h=14;  p>0,05; недостоверно. 

    Теперь  попробуйте самостоятельно применить  метод Стьюдента для зависимых  выборок к обоим распределениям опытной группы с учетом того, что вычисление частных разностей для пар дало следующие результаты:

    Sd = -59 и Sd2  = 349 

  1. Дисперсионный анализ (тест F Снедекора)
 

    Метод Снедекора — это параметрический  тест, используемый в тех случаях, когда имеются три или большее  число выборок. Сущность этого метода заключается в том, чтобы определить, является ли разброс средних для  различных выборок относительно общей средней для всей совокупности данных достоверно отличным от разброса данных относительно средней в пределах каждой выборки. Если все выборки принадлежат одной и той же популяции, то разброс между ними должен быть не больше, чем разброс данных внутри их самих. 

    В методе Снедекора в качестве показателя разброса используют вариансу  (дисперсию). Поэтому анализ сводится к тому, чтобы сравнить вариансу распределений  между выборками с вариансами в пределах каждой выборки, или: 

    t=.....; h=.....;  p..... (<, =, > ?) 0,05; недостоверно 

 

где σ2между  — варианса средних каждой выборки  относительно общей средней; 

σ2внутри — варианса данных внутри каждой выборки. Если различие между выборками недостоверно, то результат должен быть близок к I. Чем больше будет F по сравнению с 1, тем более достоверно различие.  

    Таким образом, дисперсионный анализ показывает, принадлежат ли выборки к одной  популяции, но с его помощью нельзя выделить те выборки, которые отличаются от других. Для того чтобы определить те пары выборок, разница между которыми достоверна, следует после дисперсионного анализа применить метод Шеффе. Поскольку, однако, этот весьма Ценный метод требует достаточно больших вычислений, а к нашему гипотетическому эксперименту он неприменим, мы рекомендуем читателю для ознакомления с ним обратиться к какому-либо специальному пособию по статистике. 

  1. Непараметрические методы. Метод χ2 («хи-квадрат»)
 

    Для использования непараметрического метода χ2  не требуется вычислять  среднюю или стандартное отклонение. Его преимущество состоит в том, что для применения его необходимо знать лишь зависимость распределения частот результатов от двух переменных; это позволяет выяснить, связаны они друг с другом или, наоборот, независимы. Таким образом, этот статистический метод используется для обработки качественных данных. Кроме того, с его помощью можно проверить, существует ли достоверное различие между числом людей, справляющихся или нет с заданиями какого-то интеллектуального теста, и числом этих же людей, получающих при обучении высокие или низкие оценки; между числом больных, получивших новое лекарство, и числом тех, кому это лекарство помогло; и, наконец, существует ли достоверная связь между возрастом людей и их успехом или неудачей в выполнении тестов на память и т. п. Во всех подобных случаях этот тест позволяет определить число испытуемых, удовлетворяющих одному и тому же критерию для каждой из переменных. 

    При обработке данных нашего гипотетического  эксперимента с помощью метода Стьюдента  мы убедились в том, что употребление марихуаны испытуемыми из опытной группы снизило у них эффективность выполнения задания по сравнению с контрольной группой. Однако к такому же выводу можно было бы прийти с помощью другого метода — χ2.  Для этого метода нет ограничений, свойственных методу Стьюдента: он может применяться и в тех случаях, когда распределение не является нормальным, а выборки невелики. 

    При использовании метода χ2  достаточно сравнить число испытуемых в той  и другой группе, у которых снизилась  результативность, и подсчитать, сколько среди них было получивших и не получивших наркотик; после этого проверяют, есть ли связь между этими двумя переменными. 

    Из  результатов нашего опыта, приведенных  в Таблице 1, видно, что из 30 испытуемых, составляющих опытную и контрольную группы, у 18 результативность снизилась, а 13 из них получили марихуану. Теперь надо внести значение этих так называемых эмпирических частот (Э) в специальную таблицу:   

  Результаты
Ухудшение Без изменений  или улучшение Итого
Условия После употребления наркотика 13 2 15
Без наркотика 5 10 15
Итого 18 12 30

    Далее надо сравнить эти данные с теоретическими частотами (Т), которые были бы получены, если бы все различия были чисто  случайными. Если учитывать только итоговые данные, согласно которым, с одной стороны, у 18 испытуемых результативность снизилась, а у 12 — повысилась, а с другой — 15 из всех испытуемых курили марихуану, а 15 — нет, то теоретические частоты будут следующими:   

  Результаты
Ухудшение Без изменений  или улучшение Итого
Условия После употребления наркотика 18*15/30=9 12*15/30=6 15
Без наркотика 18*15/30=9 12*15/30=6 15
Итого 18 12 30
 
 
  1. Теоретические частоты (Т)
 

    Метод χ2  состоит в том, что оценивают, насколько сходны между собой  распределения эмпирических и теоретических частот. Если разница между ними невелика, то можно полагать, что отклонения эмпирических частот от теоретических обусловлены случайностью. Если же, напротив, эти распределения будут достаточно разными, можно будет считать, что различия между ними значимы и существует связь между действием независимой переменной и распределением эмпирических частот. 

    Для вычисления χ2   определяют разницу  между каждой эмпирической и соответствующей  теоретической частотой по формуле 

 

а затем  результаты, полученные по всех таких сравнениях, складывают:

 В  нашем случае все это можно  представить следующим образом:

  Э Т Э-Т (Э-Т)2 (Э-Т)2/Т
Наркотик, улучшение 13 9 +4 16 1,77
Наркотик, ухудшение 2 6 -4 16 2,66
Без наркотика, ухудшение 5 6 -4 16 1,77
Без наркотика, улучшение 10 6 +4 16 2,66
χ=S(Э-Т)2/Т= 8,66
 

    Для расчета числа степеней свободы  число строк в табл. 2 за вычетом  единицы умножают на число столбцов за вычетом единицы. Таким образом, в нашем случае число степеней свободы равно (2- 1)*(2- 1)= 1. 

    Табличное значение χ2 для уровня значимости 0,05 и 1 степени свободы составляет 3,84. Поскольку вычисленное нами значение х2 намного больше, нулевую гипотезу можно считать опровергнутой. Значит, между употреблением наркотика и глазодвигательной координацией действительно существует связь. Следует, однако, отметить, что если число степеней свободы больше 1, то критерий х2 нельзя применять, когда в 20 или более процентах случаев теоретические частоты меньше 5 или когда хотя бы в одном случае теоретическая частота равна 0 (Siegel, 1956). 

  1. Критерий  знаков (биномиальный критерий)
 

    Критерий  знаков — это еще один непараметрический  метод, позволяющий легко проверить, повлияла ли независимая переменная на выполнение задания испытуемыми, при этом методе сначала подсчитывают число испытуемых, у которых результаты снизились, а затем сравнивают его с тем числом, которого можно было ожидать на основе чистой случайности (в нашем случае вероятность случайного события 1:2). Далее определяют разницу между этими двумя числами, чтобы выяснить, насколько она достоверна. 

    При подсчетах результаты, свидетельствующие  о повышении эффективности, берут  со знаком плюс, а о снижении —  со знаком минус; случаи отсутствия разницы  не учитывают. 

    Расчет  ведется по следующей формуле:

 

где Х  — сумма «плюсов» или сумма «минусов»; 

п/2 —  число сдвигов в ту или в  другую сторону при чистой случайности  один шанс из двух. (Такая вероятность  характерна, например, для п бросаний монеты. В случае же если п раз  бросают игральную кость, то вероятность  выпадения той или иной грани уже равна одному шансу из 6 (п/6)) 

0,5 —  поправочный коэффициент, который  добавляют к X, если X<п/2, или вычитают, если X>п/2. 

Если  мы сравним в нашем опыте результативность испытуемых до воздействия (фон) и после  воздействия, то получим 
 
 

  1. Опытная группа
 

Информация о работе Параметрические методы проверки гипотез