Методы многомерного статистического анализа

Автор работы: Пользователь скрыл имя, 02 Октября 2011 в 22:08, реферат

Краткое описание

Изучение социальных процессов ограничиваться методами пассивного эксперимента. При анкетировании, интервьюировании, тестировании он ограничивается регистрацией ответов-реакций на предложенные вопросы-признаки, которые, как предполагается, являются отражением скрытых социальных характеристик эмпирически наблюдаемого явления. В следствии этого, необходимым этапом в познании и понимании сущности социальных явлений является выявление этих латентных объясняющих характеристик (факторов, признаков) и их содержательная интерпретация.

Содержимое работы - 1 файл

Mnogomernij stat analis.doc

— 120.00 Кб (Скачать файл)

Тема 9. Методы многомерного статистического  анализа. 

1. Модели латентных  переменных в социологии.

      Изучение  социальных процессов ограничиваться методами пассивного эксперимента. При  анкетировании, интервьюировании, тестировании он ограничивается регистрацией ответов-реакций на предложенные вопросы-признаки, которые, как предполагается, являются отражением скрытых социальных характеристик эмпирически наблюдаемого явления. В следствии этого, необходимым этапом в познании и понимании сущности социальных явлений является выявление этих латентных объясняющих характеристик (факторов, признаков) и их содержательная интерпретация.

      Для выявления и изучения латентных  переменных в основном используют модели факторного анализа и латентно-структурный  анализ.

    Факторный анализ – это группа методов многомерного статистического анализа, которые позволяют представить в компактной форме обобщенную информацию о структуре связей между наблюдаемыми признаками изучаемого социального объекта. Среди задач, для решения которых используются методы факторного анализа, можно выделить следующие: понижение размерности пространства признаков; классификация объектов; выявление структуры взаимосвязей в наборе признаков; преобразование исходных переменных к более удобному для интерпретации виду; построение обобщающего показателя (индекса, шкалы); осуществление типологии объектов наблюдения; преобразование данных для использования в других моделях.

    Основное  предположение факторного анализа  заключается в том, что совокупность измеренных переменных можно выразить в виде меньшего числа показателей – факторов. Таким образом, фактор представляет собой некую «модельную» характеристику объектов изучаемого множества. Данное предположение основывается на допущении, что на наблюдаемые признаки оказывает влияние (в той или иной степени) некий не наблюдаемый признак.

2. Модели факторного  анализа, возможности  использования факторного  анализа в социологии.

    Следует различать две основных модели факторного анализа: поисковую, которая нацелена на первоначальное исследование некоего сложного явления, на поиск гипотез о структуре этого явления; и направленный факторный анализ, имеющий целью проведение направленного эксперимента для подтверждения уже выдвинутой теоретической гипотезы.

    В первом случае исследователь не имеет гипотезы относительно структуры взаимосвязей между признаками. Он исходит лишь из общего для факторного анализа предположения о наличии таких взаимосвязей и о возможности выразить их с помощью небольшого числа факторов. Подбор признаков осуществляется при этом экспертно, по принципу их связи с изучаемым явлением. Такой подход является самым распространенным в современных прикладных социально-экономических исследованиях с использованием факторного анализа. Привлечение моделей факторного анализа при таком подходе может ставить целью: выдвижение гипотезы о размерности явления, выявление наиболее информативных измерителей процесса или явления — факторов, выдвижение гипотез о природе этих факторов. В случаях, когда нет гипотезы о факторной структуре, серьезную проблему представляет интерпретация факторной матрицы. Поэтому для интерпретации полученной факторной структуры часто приходится привлекать дополнительную информацию.

    При проведении направленного факторного эксперимента с целью проверки выдвинутой априорной гипотезы объекты наблюдения и признаки отбираются в соответствии с имеющейся теоретической гипотезой. Последняя может быть сформулирована в виде каких-то априорных ограничений относительно факторов или предполагаемого вида факторной матрицы. В этом случае задача сводится к выяснению вопроса, может ли полученная эмпирическим путем корреляционная матрица быть преобразована в факторную матрицу предполагаемого вида. Подход, нацеленный на проверку гипотез, характерен для более продвинутых стадий исследования. Следует заметить, что в прикладных исследованиях экономистов и социологов (в отличие от работ психологов) такой подход все ещё редок.

    Рассмотрим  несколько типичных задач с применением факторного анализа.

    - Определение размерности изучаемого сложного явления, т. е. нахождение минимального числа наиболее существенных и относительно независимых характеристик, с достаточной полнотой описывающих изучаемое явление (свободное время, социальная экология больших городов, уровень жизни, уровень экономического развития стран и др.).

    - Преимущество факторного анализа  состоит в том, что форма  выдачи результатов, а именно  матрица факторных нагрузок, дает  материал для интерпретации размерности,  т. е. позволяет судить о  том, что же представляют собой, из чего складываются основные измерения. Эта особенность факторного анализа обусловливает его использование в качестве метода выдвижения гипотез о природе и причинном характере изучаемых взаимосвязей.

    - Построение обобщенного  показателя является некоторым вариантом задачи выявления размерности. Здесь смысл обобщенного показателя — фактора заранее ясен. Задача состоит в построении шкалы для измерения этого фактора (уровень экономического развития, уровень жизни, обобщенная характеристика размера предприятия и т. д.).

    - Задачи типологии.  Часто исследователь сталкивается с необходимостью подразделить множество наблюдаемых им объектов или явлений, описанных неким набором признаков, на максимально однородные (по этим признакам) группы. Факторный анализ используется как метод разработки критериев типологии, такими критериями служат факторы. Обычно при построении таксономии в рассмотрение включают большое число признаков, чтобы полнее охватить внутренние взаимосвязи явлений. В таких случаях полезна предварительная группировка признаков, выявление и интерпретация основных факторов. Таксономия, осуществленная отдельно по каждому фактору, легче поддается интерпретации: таксоны получают компактное описание, становится возможным сравнение таксонов по средним значениям факторов. Преимущество таксономии по факторам состоит в возможности ее визуального представления (если число факторов не более трех), что весьма облегчает интерпретацию таксонов.

    - Пространственно-временные сопоставления. Анализ системы признаков весьма часто осуществляется с целью сопоставления структуры однотипных явлений. Такое сопоставление может быть временным, (структура явления анализируется по состоянию на разные периоды времени) или пространственным (рассматривается структура нескольких однотипных явлений).

    - Проверка гипотез о взаимосвязи и взаимозаменяемости признаков. В данном случае часть переменных вводится для всесторонней характеристики условий, формирующих интересующие исследователя явления, т. е. для характеристики экологического фона, тогда как только одна или несколько переменных непосредственно представляют исследуемое явление. Анализируя связь сложного явления с показателями фона, исследователь имеет возможность проверить ряд гипотез об обусловливающих это явление факторах. Кроме того, исследуется вопрос о взаимозаменяемости различных групп переменных. Исследование подобных гипотез сводится к тому, чтобы проверить, насколько совпадают группировки опрошенных, выделенные по характеру ответов на вопросы анкеты, с одной стороны, и по социально-демографическим характеристикам — с другой. Индикатором совпадения группировок является объединение признаков обоих видов в единый фактор и теснота связи признаков с факторами, т. е. абсолютная величина факторных нагрузок. Определенная степень совпадения двух этих группировок может быть принята как оценка верности выдвинутой гипотезы. 

3. Различные подходы  к определению  числа факторов.

    Основная  цель выделения первичных факторов в факторном анализе заключается в определении минимального числа общих факторов, которые удовлетворительно воспроизводят корреляции между наблюдаемыми переменными. При отсутствии ошибок измерений и случайности в выборке, а также при выполнении принципа факторной причинности, для заданной корреляционной матрицы существует точное соответствие между минимальным числом общих факторов и рангом редуцированной корреляционной матрицы. Иными словами, в случае отсутствия ошибок в соответствии факторной модели данным число общих факторов и общности могут быть вычислены сколь угодно точно с помощью исследования ранга редуцированной корреляционной матрицы. Если же выборка является случайной, то проблема усложняется и возникает задача найти критерий, с помощью которого можно было бы оценить минимально необходимое число общих факторов. Но поскольку основной критерий определения минимального числа общих факторов заключается в хорошей воспроизводимости наблюдаемых корреляций с помощью отобранных факторов, то задачу можно переформулировать следующим образом: определить правило остановки при выделении общих факторов. Эта задача сводится к определению момента, когда расхождение между вычисленными и наблюдаемыми корреляциями может быть приписано случайности выборки.

    Главный критерий отбора системы  факторов сформулировал еще Терстоун: простота, инвариантность, единственность, т.е. каждый признак отображается минимальным количеством факторов, а факторы должны как можно лучше описывать совокупность признаков.  Иногда, руководствуясь предварительной информацией, исследователь знает, сколько факторов можно выделить, и таким образом, может заранее определить число выделяемых факторов. После извлечения желаемого числа факторов их выделение прекращают.

      Кроме того, на практике наиболее часто применяются:

  1. критерии значимости, связанные с методами максимального правдоподобия и наименьших квадратов (наиболее часто используют критерий χ2 и метод Монте-Карло; определяется значимость отдельных собственных значений). Недостаток этого метода в том, что при больших размерах выборки (больше 200) многие факторы являются статистически значимыми, хотя с практической точки зрения, многие из них объясняют лишь небольшую долю полной дисперсии.
  2. оценка надежности, выполняемой расщеплением (выборку расщепляют напополам и факторный анализ выполняют для каждой половины; при этом оставляют только факторы с высокой степенью соответствия факторных нагрузок в двух подвыборках).
  3. различные правила, формулируемые в терминах собственных чисел:
    1. при определении числа факторов часто применяют правило, которое позволяет оставлять факторы с собственными числами, большими 1. Однако как показывает практика если число переменных меньше 20, то этот метод завышает число факторов.
    1. другой метод относится к редуцированной корреляционной матрице; согласно ему сохраняются факторы с собственными числами, большими нуля. Преимущество этого метода в том, что для корреляционной матрицы генеральной совокупности он дает более точные нижние оценки числа общих факторов. Но для выборочной корреляционной матрицы критерий обычно дает значительно большее число факторов.
    2. Харман предлагает прекратить выделение общих факторов, когда сумма собственных чисел превысит сумму оценок общностей.
    1. критерий, основанный на величине доли воспроизводимой дисперсии (число выделяемых факторов определяют так, чтобы кумулятивный процент дисперсии, выделяемой факторами, достиг удовлетворительного уровня; какой уровень дисперсии считать удовлетворительным, зависит от поставленной задачи). Заметим, что критерий «собственных чисел, больших единицы», эквивалентен данному критерию для 100/п %-го уровня.  Однако рекомендуется выделять такое число факторов, которые объясняют, по крайней мере, 60% дисперсии. Основной недостаток критерия, основанного на величине доли воспроизводимой дисерсии, состоит в определенной его субъективности. Однако он основан на легко поддающейся интерпретации статистике и в этом преимущество данного метода.
    1. критерий отсеивания (рассматривается графическое изображение собственных чисел корреляционной матрицы, которые наносятся на график в порядке их убывания; выделение заканчивается на том факторе, после которого исследуемая зависимость близка к почти горизонтальной прямой линии); Этот метод был предложен Каттеллом. Кайзер скептически относится к критерию отсеивания, так как на графике можно получить более чем один излом, и тогда выделение какой-либо прямой становится субъективным.
    2. критерий интерпретируемости и инвариантности (для исключения сомнительных результатов можно попытаться применить к одним и тем же данным комбинацию различных независимых критериев и принимать только те результаты, которые подходят ко всем критериям).
 

4. Процент объясненной дисперсии как показатель качества факторной модели.

Информация о работе Методы многомерного статистического анализа