Автор работы: Пользователь скрыл имя, 22 Ноября 2010 в 23:19, доклад
Эксперимент - это опытное исследование воздействия отдельного фактора (или нескольких факторов) на интересующую исследователя переменную. Экспериментальное исследование строится в соответствии с правилами индуктивного вывода о наличии причинно-следственной связи между событиями, во-первых, демонстрируя регулярный характер появления события-<отклика> после предшествующего по времени события-воздействия и, во-вторых, исключая посредством особых приемов экспериментальной изоляции и контроля альтернативные объяснения появления <отклика> с помощью посторонних влияний и конкурирующих каузальных гипотез
В так называемых
хоуторнских экспериментах (по названию
промышленного предприятия в
Чикаго) исследовались организационные
и социально-психологические
<Хоуторнский
эффект>[116] - это угроза валидности, связанная
с особенностями экспериментальной группы.
Еще одна угроза
валидности выводов, которую позволяет
преодолеть описываемый план эксперимента,
также связана с особенностями
групп, а именно - с процессом отбора
для участия в эксперименте. Если
бы мы отказались от предварительного
тестирования и случайного распределения
испытуемых по экспериментальной и контрольной
группам, мы совершили бы методическую
ошибку, весьма характерную для любых
экспериментов с добровольцами. Очень
часто исследователи отбирают испытуемых
для участия в специальной программе обучения
или в новаторском организационном проекте,
основываясь на изъявленном ими желании,
а затем сравнивают результаты, показанные
участниками оцениваемой программы, с
результатами какой-либо другой доступной
группы (или даже случайной выборки из
соответствующей генеральной совокупности),
не участвовавшей в такого рода программе.
Однако такое сравнение некорректно: само
по себе желание участвовать в эксперименте
часто свидетельствует о изначально более
высокой мотивации, осведомленности или
интеллекте. Эти факторы сами по себе,
или взаимодействуя с главной независимой
переменной Х, могут объяснить значимые
различия в результатах, показанных экспериментальной
группой. В только что описанном примере
сравнение группы добровольцев, пожелавших
посмотреть антивоенный фильм, с прочими
студентами, может вести к завышенной
оценке воздействия просмотра, если добровольцы
изначально проявляют больший интерес
к политическим проблемам. Лишь случайное
распределение добровольцев по контрольной
и экспериментальной группам при соблюдении
<непрозрачности> такого распределения
для всех испытуемых (участники обеих
групп должны считать, что они подвергаются
некоторому экспериментальному воздействию)
позволяет судить о роли независимой переменной
X в возникновении межгрупповых различий[117].
Вышеописанные
угрозы валидности связаны преимущественно
с особенностями групп, проявляющимися
на стадии отбора или в ходе эксперимента.
Однако рандомизация позволяет справиться
и с некоторыми угрозами валидности, исходящими
от переменных внешнего окружения, фона.
К фоновым относятся, в частности, <возможные
влияния времени года или событий, возникающих
на институциональном уровне>, а также
факторы естественного развития - <все
те биологические или психологические
процессы, которые независимо от конкретных
внешних событий систематически изменяются
с течением времени>[118]. Испытуемые взрослеют,
обучаются, устают, улучшают свои результаты
при повторных тестированиях и т. п., что
может сказываться на их результатах.
Однако если такие посторонние влияния
не оказывают избирательного воздействия
только на членов экспериментальной группы,
они будут вносить вклад лишь в случайную
ошибку, а не в систематическое смещение.
Иными словами, они будут с равной вероятностью
распределены между случайным образом
отобранными участниками контрольной
и экспериментальной групп. План типа
RT1-2C позволяет обеспечить случайный и
равновероятный характер внешних, фоновых
воздействий на контрольную и экспериментальную
группу. Более того, он позволяет <вычесть>
величину фонового влияния и оценить чистый
основной эффект: если внешнее влияние
все же имело место, оно в равной степени
подействовало на показатели и экспериментальной,
и контрольной групп; следовательно, разность
между средними значениями первого и второго
замеров уровня зависимой переменной
в контрольной группе (О4 ? О3) нужно вычесть
из аналогичной разности значений зависимой
переменной, зафиксированной в экспериментальной
группе (О2? O1), т. е.:
?Х ? = ( О2? O1) ? (
О4 ? О3),
при этом предварительное
и послеэкспериментальное тестирование
в экспериментальной и
Систематическая
угроза валидности, связанная с фоновыми
факторами, может все же возникнуть и при
использовании рандомизации и контрольной
группы. Это происходит тогда, когда фоновые
факторы взаимодействуют с независимой
переменной (или некоторыми ее уровнями).
Природу такого взаимодействия легко
понять на примере исследования, в котором
изучается влияние тревожности, возникающей
в ситуации неопределенности, на успешность
решения сложных задач. В такого рода экспериментах
для создания ситуации неопределенности
и повышения реактивной тревожности (независимые
переменные) часто используют неясные
инструкции, косвенные негативные оценки
действий испытуемого, высказываемые
лицами, проводящими эксперимент (типа
<Ну-ну, посмотрим, как Вы сможете это
использовать>), а также предварительные
серии, где испытуемому приходится решать
заведомо неразрешимые задачи. Разумеется,
всем этим воздействиям (X) подвергаются
лишь члены экспериментальной группы.
Если испытуемые - это студенты, которым
в силу случайного стечения обстоятельств
через неделю предстоит сдавать экзамены,
или сотрудники подразделения фирмы, ожидающие
скорой переаттестации, то эти факторы
<фона> будут взаимодействовать с независимыми
переменными, не только суммируясь с ними,
но и усиливая их эффект. Негативные подкрепления,
получаемые в ходе эксперимента, будут
восприниматься значительно острее накануне
экзаменационной сессии или переаттестации,
а связанная с этими событиями фоновая
тревожность и неопределенность будет
взаимодействовать с тревожностью и неопределенностью,
создаваемыми преднамеренно.
Оценить чистый
эффект взаимодействия с помощью сравнения
с результатами контрольной группы вышеописанным
способом в данном случае невозможно,
так как взаимодействие фоновых смещений
с основным эффектом происходит лишь там,
где имеет место экспериментальное воздействие
X. В контрольной группе приближающееся
неприятное событие также может повлиять
на результаты итогового замера или даже
обоих замеров, но оно не будет взаимодействовать,
<перемножаться> с воздействием независимой
переменной (такое взаимодействие можно
описать в более точных терминах, однако
это требует введения некоторых статистических
понятий). Для оценки величины взаимодействия
фоновых смешивающих переменных с основным
эффектом нужны более сложные экспериментальные
планы. Некоторые из них будут обсуждаться
ниже.
Иногда имеет смысл
воспользоваться упрощенным вариантом
описанного плана с рандомизацией и контрольной
группой, а именно планом с рандомизацией
без предварительного тестирования (RTC),
который схематически выглядит следующим
образом:
R Х О1
R О2
Привлекательность
этого плана заключается прежде всего
в его экономичности. Если при распределении
испытуемых между группами и уровнями
воздействия использовалась истинная
вероятностная процедура[119], то проведение
предварительного тестирования - как в
плане КТ1-2С - лишь увеличивает стоимость
эксперимента, не оказывая существенного
влияния на качество получаемых данных.
По сути, правильно осуществленная рандомизация
(R) - это наилучшая гарантия отсутствия
изначального смещения между группами
(т. е. равенства исходных среднегрупповых
значений зависимой переменной О в контрольной
и экспериментальной группах). Кроме того,
в широкомасштабных социологических исследованиях,
а также в прикладных исследованиях в
области педагогики и социальной работы,
проведение и предварительных, и повторных
измерений зависимой переменной (политических
установок, криминального поведения и
т. п.) часто неосуществимо либо ведет к
возникновению реакции на саму процедуру
тестирования. Если, к примеру, мы изучаем
влияние участия в предвыборной групповой
дискуссии на последующую поддержку политических
партий, то предварительное измерение
политических установок может повлиять
на активность опрошенных в ходе самой
дискуссии и их последующие установки.
Можно заключить,
что план RTC предпочтителен всегда,
когда нежелательно повторное предъявление
весьма специфичных по содержанию и схожих
по форме тестов, вопросов, измерительных
процедур. Иными словами, этот план заслуживает
широкого применения в социологических
и оценочных исследованиях. Кроме того,
он является самым приемлемым средством
проведения так называемых методических
экспериментов, в которых оценивается
эффективность различных видов опроса,
способов заполнения и форматов анкет
и т. п. (примером такого методического
эксперимента является описанное в главе
<Массовые опросы> исследование Бредберна
и Судмана, в котором эффективность метода
<случайного ответа> сравнивалась с
эффективностью использования данных
административной статистики). План RTC
использовался, в частности, в одном из
практически ориентированных социальных
экспериментов по совершенствованию системы
правоохранительных и пенитенциарных
учреждений, проводившихся в США в 1960?70-е
гг.
В 1961 г. Федеральное
бюро пенитенциарных учреждений США
начало трехлетний эксперимент, целью
которого было изучить воздействие поддерживающего
консультирования и специальных реабилитационных
программ на поведение мальчиков-подростков,
находящихся в исправительных учреждениях.
Местом проведения эксперимента стала
специальная школа-колония для несовершеннолетних
правонарушителей.
При проведении
рандомизации мальчиков случайным
образом распределяли между отрядами,
где проводился эксперимент, и отрядами,
служившими контрольными (каждый отряд
жил в отдельно расположенном
корпусе). В экспериментальных отрядах
было увеличено количество воспитателей,
проводились специальные индивидуальные
и групповые консультации, использовалась
система вознаграждений за хорошее поведение.
В контрольных группах применялись обычные
методы воспитания и обучения, а также
традиционные наказания за нарушение
внутреннего распорядка. Результаты эксперимента
показали, что мальчики из экспериментальных
групп раньше покидали спецшколу, лучше
успевали в учебе, вели себя адаптивнее.
Не было обнаружено значимых различий
в показателях рецидивной преступности
для подростков из экспериментальных
и контрольных групп, освобожденных из
школы-колонии, однако ребята из экспериментальных
групп значительно отличались от ребят
из контрольных групп по показателю тяжести
вновь совершенных преступлений (первые,в
случае рецидива, совершали менее тяжкие
преступления). По результатам эксперимента
было принято решение о внедрении экспериментальной
коррекционной программы во всех подразделениях
школы[120].
Еще один популярный
план с рандомизацией и контрольной
группой - это план Соломона[121]. План Соломона
- это расширенный вариант плана RT1-2C, позволяющий
проконтролировать и оценить эффекты
естественного развития и фона, а также
определить взаимодействие эффекта тестирования
с основным воздействием X. Здесь наряду
с экспериментальной и контрольной группами
с предварительным тестированием используются
экспериментальная и контрольная группы
без предварительного тестирования (как
в плане RTC). Схематически это выглядит
следующим образом:
R O1X О2
R О3 О4
R X О5
R О6
Очевидно, что
если главный эффект X реален, то даже
при наличии существенного
До сих пор
мы обсуждали содержательные аспекты
проверки экспериментальной гипотезы
о наличии главного эффекта X с помощью
различных планов эксперимента, а также
преимущества разных планов для обеспечения
разных аспектов валидности. Очевидно,
однако, что в каждом конкретном эксперименте
величина главного эффекта, т. е. наблюдаемого
различия результатов экспериментальной
и контрольной группы, будет варьировать
не только под воздействием независимой
переменной, но и просто в результате действия
различных случайных возмущений. Конечно,
если бы наш эксперимент был идеален и
абсолютно надежен (см. выше), то при каком
угодно числе повторений мы бы всегда
получали одну и ту же истинную оценку
величины воздействия (при отсутствии
или контроле смешивающего влияния дополнительных
переменных). Однако реальные эксперименты
- особенно, как уже говорилось, эксперименты
в социальных науках - не бывают и не могут
быть идеальными и безупречно надежными.
Следовательно, перед исследователем
всегда стоит задача статистической оценки
значимости полученных результатов.
Вероятностным
<воплощением> содержательной экспериментальной
гипотезы является статистическая гипотеза.
Принятие или непринятие статистической
гипотезы - необходимое, но недостаточное
условие принятия или отвержения содержательной
гипотезы, проверяемой в эксперименте.
Проверяемая в конкретном эксперименте
статистическая гипотеза всегда формулируется
как гипотеза о том, что при бесконечном
количестве повторений этого эксперимента
среднее различие между экспериментальной
и контрольной группами (или между воздействием
разных уровней независимой переменной)
равнялось бы нулю. Такую статистическую
гипотезу, фактически сводящуюся к утверждению
о случайном характере наблюдаемых в реальном
эксперименте различий, называют нулевой
гипотезой, или нуль-гипотезой (Н0). Отвержение
или неотвержение нуль-гипотезы позволяет
говорить о том, что в данном эксперименте
содержательная гипотеза подтвердилась,
либо подтвердилась противоположная ей
альтернативная гипотеза, либо не было
получено подтверждения ни одной из них.
Вспомним воображаемый
эксперимент Фишера с чаем и молоком, описанный
в начале главы. Мы отмечали, что при использовании
тактики случайного угадывания испытуемая
смогла бы правильно определить последовательность
наполнения чашки примерно в 1 случае из
70. Следовательно, 2 <попадания> из 100
даже при очень большом количестве испытаний
едва ли могут считаться значимым результатом.
Куда достовернее выглядят 90 или даже
95 <попаданий> из 100 (оставшиеся <ошибки>
можно отнести на счет действия случайных
факторов). Чтобы определить уровень значимости
и построить доверительный интервал в
этом случае достаточно метода, описанного
в главе 8.