Особенности социальных экспериментов

Автор работы: Пользователь скрыл имя, 22 Ноября 2010 в 23:19, доклад

Краткое описание

Эксперимент - это опытное исследование воздействия отдельного фактора (или нескольких факторов) на интересующую исследователя переменную. Экспериментальное исследование строится в соответствии с правилами индуктивного вывода о наличии причинно-следственной связи между событиями, во-первых, демонстрируя регулярный характер появления события-<отклика> после предшествующего по времени события-воздействия и, во-вторых, исключая посредством особых приемов экспериментальной изоляции и контроля альтернативные объяснения появления <отклика> с помощью посторонних влияний и конкурирующих каузальных гипотез

Содержимое работы - 1 файл

Эксперимент.doc

— 223.00 Кб (Скачать файл)

Вообще, критерии значимости и статистические методы, используемые при проверке статистической гипотезы для конкретного плана  эксперимента, называют статистическими моделями. Для планов с контрольной группой основная статистическая модель - это использование t-критерия, о чем подробнее говорится чуть ниже. Для более сложных планов многомерных или факторных экспериментов, общий обзор которых дается в следующем разделе главы, ведущие статистические модели - это дисперсионный анализ и использование F-критерия Фишера. 

Итак, для того чтобы оценить статистическую значимость в элементарных рандомизированных  планах, описанных выше, нам необходимо проверить статистическую гипотезу о разности средних значений зависимой переменной в контрольной и экспериментальной группах. Конкретное значение разности средних значений зависимой переменной в экспериментальной и контрольной группе, обнаруженное в отдельном эксперименте (скажем, 4 балла по некоторой <шкале пацифизма>), нужно соотнести с определенным интервалом, в который это значение <укладывается> с заданной (доверительной) вероятностью. Иными словами, нужно решить задачу интервального оценивания, подобную задаче оценки отдельного параметра совокупности в выборочном обследовании (эта задача описана в гл. 8). Разница в том, что проводя эксперимент, мы интересуемся не вероятными пределами, в которых лежит некая характеристика выборки из реально существующей совокупности, а пределами, в которых лежит полученный нами в эксперименте результат относительно результата воображаемой бесконечной совокупности идентичных экспериментов. Нулевая гипотеза утверждает, что истинное значение различия средних равно нулю, варьируя в каких-то пределах от эксперимента к эксперименту (т. е. . Если удается показать, что полученное в эксперименте значение разности групповых средних не позволяет принять нулевую гипотезу, то делается вывод о подтверждении гипотезы, противоположной нулевой (т.е.  - о статистической значимости различий между группами - и, значит, о подтверждении экспериментальной гипотезы (или о подтверждении гипотезы, противоположной экспериментальной, - если различие между экспериментальной и контрольной группой оказалось с обратным знаком). Заметьте, что нулевая гипотеза всегда формулируется как гипотеза о том, что истинное значение разности средних (или, скажем, величины взаимосвязи между двумя переменными) равно нулю, а полученные в эксперименте величины отличаются от нуля исключительно из-за случайной ошибки выборки. Чем дальше от нуля - в ту или другую сторону - расположено наблюдаемое значение, тем больше его статистическая значимость и меньше вероятность того, что оно явилось результатом ошибки выборки. 

Для того чтобы  сравнить полученное в эксперименте с контрольной и экспериментальной группами значение разности между средними с гипотетическим выборочным распределением этой величины для бесконечного числа испытаний (такие распределения имеются не только для разности средних, но и для средних величин, стандартных отклонений и т. д.), нужно высчитать стандартную ошибку разности между средними[123]. Формула для стандартной ошибки разности между средними - SМэ-Мk -немного отличается от формулы стандартной ошибки средней SM20, приведенной в главе 8. Тем не менее она весьма проста: 
 
 

  

где Sэ и SK- величины стандартного отклонения, рассчитанные для экспериментальной и контрольной  групп, nэ и пk- число наблюдений (испытуемых) в экспериментальной  и контрольной группах. 

После этого  нужно определить, на сколько единиц стандартной ошибки отстоит полученная разность средних  от нуля, представляю  щего собой - в согласии с нуль-гипотезой - среднее гипотетического распределения  разностей средних, t-распределения. Для этого полученную в эксперименте разность групповых средних нужно перевести в t-единицы (т. е. единицы стандартного отклонения для t-распределения). Для данной разности средних величину t можно высчитать по формуле: 
 
 

Полученное значение t нужно сравнить с соответствующим значением из таблицы t-распределения для избранного уровня значимости (р = 0,05 или 0,01) и числа степеней свободы, соответствующего количеству наблюдений в каждой группе (или подвыборке). Число степеней свободы - довольно сложное статистическое понятие, анализ которого выходит за пределы этого учебника (в самом общем виде оно обсуждается в гл. 7). На практике число степеней свободы можно рассматривать как величину, равную числу наблюдений (испытуемых, опрошенных, баллов и т. п.) минус число оцениваемых параметров. Для разности средних двух групп это составит число наблюдений в экспериментальной группе минус один (nэ ? 1) плюс число наблюдений в контрольной группе минус один (пk ? 1): 

Nст.своб. = (nэ  ? 1) + (пk ? 1) 

Таблицы t-распределения  можно найти в любом учебнике или справочнике по статистике (см. <Дополнительную литературу> к данной главе, а также к гл. 8). Здесь мы приводим лишь фрагмент такой таблицы.

Таблица 4.1  

Сокращенная таблица t-распределения  

Стьюдента (W. Gosset, 1908) 

 Число степеней свободы 

Р = 0,05 

Р = 0,01 

t = 12,706 

t = 63,657 

t = 4,303 

t = 9,925 

t = 2,571 

t = 4,032 

t = 2,306 

t = 3,355 

10 

t = 2,228 

t = 3,169 

14 

t = 2,145 

t = 2,977 

16 

t = 2,120 

t = 2,921 

20 

t = 2,086 

t = 2,845 

30 

t = 2,042 

t = 2,750 

60 

t = 2,000 

t = 2,660 

120 

t = 1,980 

t = 2,617 

t = 1,960 

t = 2,576 
 

Рассмотрим пример вычисления t для описанного выше эксперимента, в котором изучалось воздействие  антивоенного фильма на изменение установок  студентов. Пусть для контрольной и экспериментальной групп при итоговом тестировании по шкале пацифистских установок были получены следующие результаты:Контрольная группа Экспериментальная группа 

nk = 28 чел. 

Nэ = 34 чел. 
 
 
 

Sk = 5,6 

Sэ= 3,4 
 

Наша статистическая задача заключается в том, чтобы определить, отличаются ли средние двух групп настолько, чтобы можно было отвергнуть нулевую гипотезу о том, что эти средние взяты из одной генеральной совокупности. Воспользуемся приведенной выше формулой для вычисления значения t[124]: 
 
 

Число степеней свободы в приведенном примере: (28 ? 1) + (34 ? 1) = 60. 

Полученное значение t = 3,4760 заведомо превосходит табличные  значения и для p < 0,05, и для р < 0,01 (на 5%-м уровне значение t для 60 степеней свободы составит 2,00, а  на 1%-м - 2,660). Следовательно, мы можем отклонить нулевую гипотезу и сделать вывод, что существует статистически значимая разница между средними уровнями пацифизма в группе студентов, посмотревших антивоенный фильм, и в контрольной группе. 

Важно, однако, всегда помнить о том, что статистическая значимость результатов совершенно отлична от их содержательной значимости! Даже высокая статистическая значимость результатов эксперимента не гарантирует, что эти результаты будут иметь сколько-нибудь интересную интерпретацию и повлияют на состояние современного социологического знания. Содержательная значимость зависит прежде всего от нашей способности увязать экспериментальную гипотезу с существующими социологическими теориями. 

  

Многомерные и  факторные эксперименты:  

общий обзор 

В описанных  выше экспериментах с контрольной  группой каждый раз используются лишь два типа условий - <есть воздействие> либо <нет воздействия>. Эти два  типа условий по сути можно рассматривать  как два уровня независимой переменной, которым можно присвоить условные числовые значения - например, <1> и <0>. Иными словами, с точки зрения уровня измерения независимая переменная является номинальной, качественной. В контрольной группе ее значение равно нулю, в экспериментальной - единице. Однако исследователь часто располагает значительно большей информацией о независимой переменной и способен измерить и проконтролировать ее по крайней мере на трех-четырех уровнях значений. Соответственно экспериментальная гипотеза может быть сформулирована в терминах более или менее интенсивного воздействия либо наличия-отсутствия <отклика> зависимой переменной при конкретных уровнях независимой переменной. 

В психологии хорошо известен закон <оптимума мотивации>, так называемый закон Йеркса-Додсона. 

В начале нашего века Р. Йеркс изучал, как влияет негативное подкрепление в форме удара электрическим током на выработку элементарных навыков у животных. В частности, в опытах с <танцующими мышами> (разновидность домашней мыши, имеющая генетический дефект, который заставляет ее двигаться по кругу или по восьмерке) он использовал три уровня силы тока - <сильный> (500 усл. ед.), <средний> (300 усл. ед.) и <слабый> (125 усл. ед.). Мышь должна была научиться выбирать один из двух туннелей. В конце туннеля ее в любом случае ожидало <вознаграждение> - мышь противоположного пола. При ошибочном выборе (белый туннель) мышь испытывала удар током, при правильном выборе (черный туннель) негативное подкрепление отсутствовало. Местоположение туннелей (слева-справа) менялось случайным образом от пробы к пробе. Выяснилось, что быстрее всего обучение происходит при <средней> величине стимуляции. Обнаруженный в этом эксперименте нелинейный характер связи между величиной стимула к решению определенной задачи и успешностью решения был затем неоднократно подтвержден и во многих других экспериментах, в том числе с испытуемыми-людьми и с позитивной стимуляцией. Чрезмерная мотивация и чрезмерная величина подкрепления, как и слабая мотивация, всякий раз оказывали меньшее воздействие на успешность выполнения различных задач. 

Эксперименты, в  которых используется несколько (более  двух) уровней независимой переменной, называются многоуровневыми. Схема  вышеописанного эксперимента с рандомизацией  и тремя уровнями независимой  переменной (Х1Х2, Х3) такова:R X1 O1 

  

  

X2 

O2 

  

R X3 

O3 
 
 

Экспериментальная гипотеза в этом случае формулируется  как гипотеза об отношениях значений О1, О2 и О3(в рассмотренном примере  О1 < О2и O2 > O3). Независимая переменная в многомерном эксперименте может  иметь и более трех уровней. Иначе говоря, она может быть <нормальной> количественной переменной, измеренной на интервальном или абсолютном уровне. Соответственно гипотеза многомерного эксперимента может формулироваться в более точных терминах - как гипотеза об <относительно-абсолютных> или даже <абсолютно-абсолютных> отношениях переменных. Например, в эксперименте может изучаться влияние привлекательности лектора на частоту посещения занятий студентами, воздействие количества доступных источников информации о продукте на формирование потребительских предпочтений либо характер взаимосвязи между размером денежного вознаграждения испытуемых и успешностью решения ими однотипных задач. Таким образом, многомерные эксперименты позволяют проверять более тонкие и точные содержательные гипотезы о механизмах индивидуального и группового поведения. 

Статистические  гипотезы, проверяемые в многомерных  экспериментах, - это гипотезы о различиях  между значениями зависимой переменной для разных уровней независимой  переменной. Нулевая гипотеза формулируется как гипотеза о том, что разброс индивидуальных значений внутри одного уровня независимой переменной (внутри соответствующей экспериментальной группы) идентичен разбросу индивидуальных значений между различными уровнями (группами), т. е. отношение дисперсии межгрупповых оценок к дисперсии внутригрупповых оценок равно 1. Последнее отношение обозначается как F-критерий. Для того чтобы определить, не превышает ли полученная в конкретном 8 эксперименте величина F пороговое значение статистического F-распределения для заданного уровня значимости, используют статистическую технику однофакторного дисперсионного анализа. Термин <однофакторный> в данном случае означает, что в эксперименте использовалась лишь одна независимая переменная (фактор воздействия). Рассмотрение техники дисперсионного анализа и статистического оценивания получаемой в результате величины F выходит за пределы данного обзора (детальные описания и рекомендации при необходимости можно найти в книгах из списка дополнительной литературы к главе). 

Информация о работе Особенности социальных экспериментов