Автор работы: Пользователь скрыл имя, 22 Ноября 2010 в 23:19, доклад
Эксперимент - это опытное исследование воздействия отдельного фактора (или нескольких факторов) на интересующую исследователя переменную. Экспериментальное исследование строится в соответствии с правилами индуктивного вывода о наличии причинно-следственной связи между событиями, во-первых, демонстрируя регулярный характер появления события-<отклика> после предшествующего по времени события-воздействия и, во-вторых, исключая посредством особых приемов экспериментальной изоляции и контроля альтернативные объяснения появления <отклика> с помощью посторонних влияний и конкурирующих каузальных гипотез
Вообще, критерии
значимости и статистические методы,
используемые при проверке статистической
гипотезы для конкретного плана
эксперимента, называют статистическими
моделями. Для планов с контрольной группой
основная статистическая модель - это
использование t-критерия, о чем подробнее
говорится чуть ниже. Для более сложных
планов многомерных или факторных экспериментов,
общий обзор которых дается в следующем
разделе главы, ведущие статистические
модели - это дисперсионный анализ и использование
F-критерия Фишера.
Итак, для того
чтобы оценить статистическую значимость
в элементарных рандомизированных
планах, описанных выше, нам необходимо
проверить статистическую гипотезу
о разности средних значений зависимой
переменной в контрольной и экспериментальной
группах. Конкретное значение разности
средних значений зависимой переменной
в экспериментальной и контрольной группе,
обнаруженное в отдельном эксперименте
(скажем, 4 балла по некоторой <шкале пацифизма>),
нужно соотнести с определенным интервалом,
в который это значение <укладывается>
с заданной (доверительной) вероятностью.
Иными словами, нужно решить задачу интервального
оценивания, подобную задаче оценки отдельного
параметра совокупности в выборочном
обследовании (эта задача описана в гл.
8). Разница в том, что проводя эксперимент,
мы интересуемся не вероятными пределами,
в которых лежит некая характеристика
выборки из реально существующей совокупности,
а пределами, в которых лежит полученный
нами в эксперименте результат относительно
результата воображаемой бесконечной
совокупности идентичных экспериментов.
Нулевая гипотеза утверждает, что истинное
значение различия средних равно нулю,
варьируя в каких-то пределах от эксперимента
к эксперименту (т. е. . Если удается показать,
что полученное в эксперименте значение
разности групповых средних не позволяет
принять нулевую гипотезу, то делается
вывод о подтверждении гипотезы, противоположной
нулевой (т.е. - о статистической значимости
различий между группами - и, значит, о
подтверждении экспериментальной гипотезы
(или о подтверждении гипотезы, противоположной
экспериментальной, - если различие между
экспериментальной и контрольной группой
оказалось с обратным знаком). Заметьте,
что нулевая гипотеза всегда формулируется
как гипотеза о том, что истинное значение
разности средних (или, скажем, величины
взаимосвязи между двумя переменными)
равно нулю, а полученные в эксперименте
величины отличаются от нуля исключительно
из-за случайной ошибки выборки. Чем дальше
от нуля - в ту или другую сторону - расположено
наблюдаемое значение, тем больше его
статистическая значимость и меньше вероятность
того, что оно явилось результатом ошибки
выборки.
Для того чтобы
сравнить полученное в эксперименте с
контрольной и экспериментальной группами
значение разности между средними с гипотетическим
выборочным распределением этой величины
для бесконечного числа испытаний (такие
распределения имеются не только для разности
средних, но и для средних величин, стандартных
отклонений и т. д.), нужно высчитать стандартную
ошибку разности между средними[123]. Формула
для стандартной ошибки разности между
средними - SМэ-Мk -немного отличается от
формулы стандартной ошибки средней SM20,
приведенной в главе 8. Тем не менее она
весьма проста:
где Sэ и SK- величины
стандартного отклонения, рассчитанные
для экспериментальной и
После этого
нужно определить, на сколько единиц
стандартной ошибки отстоит полученная
разность средних от нуля, представляю
щего собой - в согласии с нуль-гипотезой
- среднее гипотетического
Полученное значение
t нужно сравнить с соответствующим
значением из таблицы t-распределения
для избранного уровня значимости (р =
0,05 или 0,01) и числа степеней свободы, соответствующего
количеству наблюдений в каждой группе
(или подвыборке). Число степеней свободы
- довольно сложное статистическое понятие,
анализ которого выходит за пределы этого
учебника (в самом общем виде оно обсуждается
в гл. 7). На практике число степеней свободы
можно рассматривать как величину, равную
числу наблюдений (испытуемых, опрошенных,
баллов и т. п.) минус число оцениваемых
параметров. Для разности средних двух
групп это составит число наблюдений в
экспериментальной группе минус один
(nэ ? 1) плюс число наблюдений в контрольной
группе минус один (пk ? 1):
Nст.своб. = (nэ
? 1) + (пk ? 1)
Таблицы t-распределения можно найти в любом учебнике или справочнике по статистике (см. <Дополнительную литературу> к данной главе, а также к гл. 8). Здесь мы приводим лишь фрагмент такой таблицы.
Таблица 4.1
Сокращенная таблица
t-распределения
Стьюдента (W. Gosset,
1908)
Число степеней свободы
Р = 0,05
Р = 0,01
1
t = 12,706
t = 63,657
2
t = 4,303
t = 9,925
5
t = 2,571
t = 4,032
8
t = 2,306
t = 3,355
10
t = 2,228
t = 3,169
14
t = 2,145
t = 2,977
16
t = 2,120
t = 2,921
20
t = 2,086
t = 2,845
30
t = 2,042
t = 2,750
60
t = 2,000
t = 2,660
120
t = 1,980
t = 2,617
?
t = 1,960
t = 2,576
Рассмотрим пример
вычисления t для описанного выше эксперимента,
в котором изучалось
nk = 28 чел.
Nэ = 34 чел.
Sk = 5,6
Sэ= 3,4
Наша статистическая
задача заключается в том, чтобы определить,
отличаются ли средние двух групп настолько,
чтобы можно было отвергнуть нулевую гипотезу
о том, что эти средние взяты из одной генеральной
совокупности. Воспользуемся приведенной
выше формулой для вычисления значения
t[124]:
Число степеней
свободы в приведенном примере:
(28 ? 1) + (34 ? 1) = 60.
Полученное значение
t = 3,4760 заведомо превосходит табличные
значения и для p < 0,05, и для р
< 0,01 (на 5%-м уровне значение t для 60
степеней свободы составит 2,00, а
на 1%-м - 2,660). Следовательно, мы можем отклонить
нулевую гипотезу и сделать вывод, что
существует статистически значимая разница
между средними уровнями пацифизма в группе
студентов, посмотревших антивоенный
фильм, и в контрольной группе.
Важно, однако, всегда
помнить о том, что статистическая значимость
результатов совершенно отлична от их
содержательной значимости! Даже высокая
статистическая значимость результатов
эксперимента не гарантирует, что эти
результаты будут иметь сколько-нибудь
интересную интерпретацию и повлияют
на состояние современного социологического
знания. Содержательная значимость зависит
прежде всего от нашей способности увязать
экспериментальную гипотезу с существующими
социологическими теориями.
Многомерные и
факторные эксперименты:
общий обзор
В описанных
выше экспериментах с контрольной
группой каждый раз используются
лишь два типа условий - <есть воздействие>
либо <нет воздействия>. Эти два
типа условий по сути можно рассматривать
как два уровня независимой переменной,
которым можно присвоить условные числовые
значения - например, <1> и <0>. Иными
словами, с точки зрения уровня измерения
независимая переменная является номинальной,
качественной. В контрольной группе ее
значение равно нулю, в экспериментальной
- единице. Однако исследователь часто
располагает значительно большей информацией
о независимой переменной и способен измерить
и проконтролировать ее по крайней мере
на трех-четырех уровнях значений. Соответственно
экспериментальная гипотеза может быть
сформулирована в терминах более или менее
интенсивного воздействия либо наличия-отсутствия
<отклика> зависимой переменной при
конкретных уровнях независимой переменной.
В психологии хорошо
известен закон <оптимума мотивации>,
так называемый закон Йеркса-Додсона.
В начале нашего
века Р. Йеркс изучал, как влияет негативное
подкрепление в форме удара электрическим
током на выработку элементарных навыков
у животных. В частности, в опытах с <танцующими
мышами> (разновидность домашней мыши,
имеющая генетический дефект, который
заставляет ее двигаться по кругу или
по восьмерке) он использовал три уровня
силы тока - <сильный> (500 усл. ед.), <средний>
(300 усл. ед.) и <слабый> (125 усл. ед.). Мышь
должна была научиться выбирать один из
двух туннелей. В конце туннеля ее в любом
случае ожидало <вознаграждение> - мышь
противоположного пола. При ошибочном
выборе (белый туннель) мышь испытывала
удар током, при правильном выборе (черный
туннель) негативное подкрепление отсутствовало.
Местоположение туннелей (слева-справа)
менялось случайным образом от пробы к
пробе. Выяснилось, что быстрее всего обучение
происходит при <средней> величине
стимуляции. Обнаруженный в этом эксперименте
нелинейный характер связи между величиной
стимула к решению определенной задачи
и успешностью решения был затем неоднократно
подтвержден и во многих других экспериментах,
в том числе с испытуемыми-людьми и с позитивной
стимуляцией. Чрезмерная мотивация и чрезмерная
величина подкрепления, как и слабая мотивация,
всякий раз оказывали меньшее воздействие
на успешность выполнения различных задач.
Эксперименты, в
которых используется несколько (более
двух) уровней независимой
R
X2
O2
R X3
O3
Экспериментальная
гипотеза в этом случае формулируется
как гипотеза об отношениях значений
О1, О2 и О3(в рассмотренном примере
О1 < О2и O2 > O3). Независимая переменная
в многомерном эксперименте может
иметь и более трех уровней. Иначе
говоря, она может быть <нормальной>
количественной переменной, измеренной
на интервальном или абсолютном уровне.
Соответственно гипотеза многомерного
эксперимента может формулироваться в
более точных терминах - как гипотеза об
<относительно-абсолютных> или даже
<абсолютно-абсолютных> отношениях
переменных. Например, в эксперименте
может изучаться влияние привлекательности
лектора на частоту посещения занятий
студентами, воздействие количества доступных
источников информации о продукте на формирование
потребительских предпочтений либо характер
взаимосвязи между размером денежного
вознаграждения испытуемых и успешностью
решения ими однотипных задач. Таким образом,
многомерные эксперименты позволяют проверять
более тонкие и точные содержательные
гипотезы о механизмах индивидуального
и группового поведения.
Статистические
гипотезы, проверяемые в многомерных
экспериментах, - это гипотезы о различиях
между значениями зависимой переменной
для разных уровней независимой
переменной. Нулевая гипотеза формулируется
как гипотеза о том, что разброс индивидуальных
значений внутри одного уровня независимой
переменной (внутри соответствующей экспериментальной
группы) идентичен разбросу индивидуальных
значений между различными уровнями (группами),
т. е. отношение дисперсии межгрупповых
оценок к дисперсии внутригрупповых оценок
равно 1. Последнее отношение обозначается
как F-критерий. Для того чтобы определить,
не превышает ли полученная в конкретном
8 эксперименте величина F пороговое значение
статистического F-распределения для заданного
уровня значимости, используют статистическую
технику однофакторного дисперсионного
анализа. Термин <однофакторный> в данном
случае означает, что в эксперименте использовалась
лишь одна независимая переменная (фактор
воздействия). Рассмотрение техники дисперсионного
анализа и статистического оценивания
получаемой в результате величины F выходит
за пределы данного обзора (детальные
описания и рекомендации при необходимости
можно найти в книгах из списка дополнительной
литературы к главе).