Автор работы: Пользователь скрыл имя, 16 Ноября 2011 в 15:21, курсовая работа
Задачи индуктивной статистики заключаются в том, чтобы определять, насколько вероятно, что две выборки принадлежат к одной популяции.
Давайте наложим друг на друга, с одной стороны, две кривые — до и после воздействия — для контрольной группы и, с другой стороны, две аналогичные кривые для опытной группы. При этом масштаб кривых должен быть одинаковым.
Индуктивная статистика
Проверка гипотез
Параметрические методы. Метод Стьюдента (f-тест)
Степени свободы
Метод Стьюдента для зависимых выборок
Контрольная группа. Сравнение результатов для фона и после воздействия
Дисперсионный анализ (тест F Снедекора)
Непараметрические методы. Метод χ2 («хи-квадрат»)
Теоретические частоты (Т)
Критерий знаков (биномиальный критерий)
Опытная группа
Другие непараметрические критерии
Литература
Если
же речь идет о двух зависимых выборках,
то в основе расчета лежит вычисление
суммы разностей, полученных для
каждой пары результатов (т.е., например,
разностей между результатами до
и после воздействия на одного
и того же испытуемого). Поскольку одну
(любую) из этих разностей можно вычислить,
зная остальные разности и их сумму, число
степеней свободы для определения критерия
t будет равно n-1.
К
зависимым выборкам относятся, например,
результаты одной и той же группы испытуемых
до и после воздействия независимой переменной.
В нашем случае с помощью статистических
методов для зависимых выборок можно проверить
гипотезу о достоверности разницы между
фоновым уровнем и уровнем после воздействия
отдельно для опытной и для контрольной
группы.
Для
определения достоверности
где d —
разность между результатами в каждой
паре; Sd — сумма этих частных разностей;
Sd2 — сумма квадратов частных разностей.
Полученные результаты сверяют с таблицей
t, отыскивая в ней значения, соответствующие
n-1 степени свободы; n — это в данном случае
число пар данных.
Перед
тем как использовать формулу, необходимо
вычислить для каждой группы частные разности
между результатами во всех парах, квадрат
каждой из этих разностей, сумму этих разностей
и сумму их квадратов.
Необходимо
произвести следующие операции:
Испытуемые | Фон | После воздействия | d | d2 |
Д1 | 19 | 21 | +2 | 4 |
2 | 10 | 8 | -2 | 4 |
3 | 12 | 13 | +1 | 1 |
4 | 13 | 11 | -2 | 4 |
5 | 17 | 20 | +3 | 9 |
6 | 14 | 12 | -2 | 4 |
7 | 17 | 15 | -2 | 4 |
Ю1 | 15 | 17 | +2 | 4 |
2 | 14 | 15 | +1 | 1 |
3 | 15 | 15 | - | - |
4 | 17 | 18 | +1 | 1 |
5 | 15 | 16 | +1 | 1 |
6 | 18 | 15 | -3 | 9 |
7 | 19 | 19 | - | - |
8 | 22 | 25 | +3 | 9 |
Sd = +3; Sd2 = 55 |
Величина
t=0,39 ниже той, которая необходима для
уровня значимости 0,05 при 14 степенях свободы.
Иными словами, порог вероятности
для такого t выше 0,05. Таким образом,
нулевая гипотеза не может быть отвергнута,
и разница между выборками недостоверна.
В сокращенном виде это записывается следующим
образом:
t=0,39;
h=14; p>0,05; недостоверно.
Теперь попробуйте самостоятельно применить метод Стьюдента для зависимых выборок к обоим распределениям опытной группы с учетом того, что вычисление частных разностей для пар дало следующие результаты:
Sd
= -59 и Sd2 = 349
Метод
Снедекора — это
В
методе Снедекора в качестве показателя
разброса используют вариансу (дисперсию).
Поэтому анализ сводится к тому,
чтобы сравнить вариансу распределений
между выборками с вариансами
в пределах каждой выборки, или:
t=.....;
h=.....; p..... (<, =, > ?) 0,05; недостоверно
где σ2между
— варианса средних каждой выборки
относительно общей средней;
σ2внутри
— варианса данных внутри каждой выборки.
Если различие между выборками недостоверно,
то результат должен быть близок к I.
Чем больше будет F по сравнению с 1, тем
более достоверно различие.
Таким
образом, дисперсионный анализ показывает,
принадлежат ли выборки к одной
популяции, но с его помощью нельзя
выделить те выборки, которые отличаются
от других. Для того чтобы определить
те пары выборок, разница между которыми
достоверна, следует после дисперсионного
анализа применить метод Шеффе. Поскольку,
однако, этот весьма Ценный метод требует
достаточно больших вычислений, а к нашему
гипотетическому эксперименту он неприменим,
мы рекомендуем читателю для ознакомления
с ним обратиться к какому-либо специальному
пособию по статистике.
Для
использования
При
обработке данных нашего гипотетического
эксперимента с помощью метода Стьюдента
мы убедились в том, что употребление марихуаны
испытуемыми из опытной группы снизило
у них эффективность выполнения задания
по сравнению с контрольной группой. Однако
к такому же выводу можно было бы прийти
с помощью другого метода — χ2. Для
этого метода нет ограничений, свойственных
методу Стьюдента: он может применяться
и в тех случаях, когда распределение не
является нормальным, а выборки невелики.
При
использовании метода χ2 достаточно
сравнить число испытуемых в той
и другой группе, у которых снизилась
результативность, и подсчитать, сколько
среди них было получивших и не получивших
наркотик; после этого проверяют, есть
ли связь между этими двумя переменными.
Из результатов нашего опыта, приведенных в Таблице 1, видно, что из 30 испытуемых, составляющих опытную и контрольную группы, у 18 результативность снизилась, а 13 из них получили марихуану. Теперь надо внести значение этих так называемых эмпирических частот (Э) в специальную таблицу:
Результаты | ||||
Ухудшение | Без изменений или улучшение | Итого | ||
Условия | После употребления наркотика | 13 | 2 | 15 |
Без наркотика | 5 | 10 | 15 | |
Итого | 18 | 12 | 30 |
Далее надо сравнить эти данные с теоретическими частотами (Т), которые были бы получены, если бы все различия были чисто случайными. Если учитывать только итоговые данные, согласно которым, с одной стороны, у 18 испытуемых результативность снизилась, а у 12 — повысилась, а с другой — 15 из всех испытуемых курили марихуану, а 15 — нет, то теоретические частоты будут следующими:
Результаты | ||||
Ухудшение | Без изменений или улучшение | Итого | ||
Условия | После употребления наркотика | 18*15/30=9 | 12*15/30=6 | 15 |
Без наркотика | 18*15/30=9 | 12*15/30=6 | 15 | |
Итого | 18 | 12 | 30 |
Метод
χ2 состоит в том, что оценивают,
насколько сходны между собой
распределения эмпирических и теоретических
частот. Если разница между ними невелика,
то можно полагать, что отклонения эмпирических
частот от теоретических обусловлены
случайностью. Если же, напротив, эти распределения
будут достаточно разными, можно будет
считать, что различия между ними значимы
и существует связь между действием независимой
переменной и распределением эмпирических
частот.
Для
вычисления χ2 определяют разницу
между каждой эмпирической и соответствующей
теоретической частотой по формуле
а затем результаты, полученные по всех таких сравнениях, складывают:
В нашем случае все это можно представить следующим образом:
Э | Т | Э-Т | (Э-Т)2 | (Э-Т)2/Т | |
Наркотик, улучшение | 13 | 9 | +4 | 16 | 1,77 |
Наркотик, ухудшение | 2 | 6 | -4 | 16 | 2,66 |
Без наркотика, ухудшение | 5 | 6 | -4 | 16 | 1,77 |
Без наркотика, улучшение | 10 | 6 | +4 | 16 | 2,66 |
χ=S(Э-Т)2/Т= | 8,66 |
Для
расчета числа степеней свободы
число строк в табл. 2 за вычетом
единицы умножают на число столбцов
за вычетом единицы. Таким образом,
в нашем случае число степеней
свободы равно (2- 1)*(2- 1)= 1.
Табличное
значение χ2 для уровня значимости 0,05
и 1 степени свободы составляет 3,84. Поскольку
вычисленное нами значение х2 намного
больше, нулевую гипотезу можно считать
опровергнутой. Значит, между употреблением
наркотика и глазодвигательной координацией
действительно существует связь. Следует,
однако, отметить, что если число степеней
свободы больше 1, то критерий х2 нельзя
применять, когда в 20 или более процентах
случаев теоретические частоты меньше
5 или когда хотя бы в одном случае теоретическая
частота равна 0 (Siegel, 1956).
Критерий
знаков — это еще один непараметрический
метод, позволяющий легко проверить,
повлияла ли независимая переменная
на выполнение задания испытуемыми,
при этом методе сначала подсчитывают
число испытуемых, у которых результаты
снизились, а затем сравнивают его с тем
числом, которого можно было ожидать на
основе чистой случайности (в нашем случае
вероятность случайного события 1:2). Далее
определяют разницу между этими двумя
числами, чтобы выяснить, насколько она
достоверна.
При
подсчетах результаты, свидетельствующие
о повышении эффективности, берут
со знаком плюс, а о снижении —
со знаком минус; случаи отсутствия разницы
не учитывают.
Расчет ведется по следующей формуле:
где Х
— сумма «плюсов» или сумма «минусов»;
п/2 —
число сдвигов в ту или в
другую сторону при чистой случайности
один шанс из двух. (Такая вероятность
характерна, например, для п бросаний
монеты. В случае же если п раз
бросают игральную кость, то вероятность
выпадения той или иной грани уже равна
одному шансу из 6 (п/6))
0,5 —
поправочный коэффициент,
Если
мы сравним в нашем опыте