Методы многомерного статистического анализа

Автор работы: Пользователь скрыл имя, 02 Октября 2011 в 22:08, реферат

Краткое описание

Изучение социальных процессов ограничиваться методами пассивного эксперимента. При анкетировании, интервьюировании, тестировании он ограничивается регистрацией ответов-реакций на предложенные вопросы-признаки, которые, как предполагается, являются отражением скрытых социальных характеристик эмпирически наблюдаемого явления. В следствии этого, необходимым этапом в познании и понимании сущности социальных явлений является выявление этих латентных объясняющих характеристик (факторов, признаков) и их содержательная интерпретация.

Содержимое работы - 1 файл

Mnogomernij stat analis.doc

— 120.00 Кб (Скачать файл)

Если предположить некоррелированными между собой  характерные и общие факторы, то суммарную дисперсию можно представить следующим образом:

                         m

dj2 = 1 = Sajp2 + dj2 ,                                                                  

                         р=1

    В правой части данного соотношения  стоят квадраты факторных нагрузок. Каждое слагаемое определяет обусловленную соответствующим фактором долю дисперсии наблюдаемого признака, т.е. вся дисперсия может быть разделена на две части:

  • дисперсию, обусловленную наличием общих факторов (сумму квадратов общих факторов принято называть общностью):

             m

h2j = Sajp2,

            p=1

  • дисперсию, обусловленную вариацией характерного фактора (квадрат нагрузки характерного фактора dj2 называют характерностью). Иногда удобно разбивать характерность на две части: ту, что действительно связана со спецификой изучаемых параметров, и ту, что связана с ошибками измерений. Если к заданному набору параметров добавить несколько новых, то изучение добавочных коэффициентов корреляции может привести к появлению дополнительных общих факторов. Это означает, что при рассмотрении первоначального набора параметров эти возможные связи данного параметра отражались в той доле характерности, которая связана с действительной спецификой параметра. Эта доля называется специфичностью параметра. Оставшаяся доля, связанная с несовершенством измерений, называется дисперсией ошибки или ненадежностью параметра.

Поскольку факторы  специфичности и ошибки между  собой некоррелированны, для характерности  и составляющих ее частей справедливо  соотношение:

dj2 = bj2 + ej2.

Тогда суммарная  дисперсия может быть записана в  виде:

                      m

dj2 = 1 = Sajp2 + dj2 = hj2 + bj2 + ej2.     

                     Р=1

Таким образом, суммарная дисперсия состоит  из общности (соответствует факторам F) и характерности, или иначе, суммарная дисперсия параметра состоит из общности, специфичности (соответствует факторам S) и дисперсии ошибки (соответствует факторам E). 

5. Факторный анализ  как метод понижения  размерности пространства  признаков. 

    Факторный анализ – это группа методов многомерного статистического анализа, которые позволяют представить в компактной форме обобщенную информацию о структуре связей между наблюдаемыми признаками изучаемого социального объекта. Среди задач, для решения которых используются методы факторного анализа, можно выделить следующие: понижение размерности пространства признаков; классификация объектов; выявление структуры взаимосвязей в наборе признаков; преобразование исходных переменных к более удобному для интерпретации виду; построение обобщающего показателя (индекса, шкалы); осуществление типологии объектов наблюдения; преобразование данных для использования в других моделях.

    Основное  предположение факторного анализа  заключается в том, что совокупность измеренных переменных можно выразить в виде меньшего числа показателей – факторов. Таким образом, фактор представляет собой некую «модельную» характеристику объектов изучаемого множества. Данное предположение основывается на допущении, что на наблюдаемые признаки оказывает влияние (в той или иной степени) некий не наблюдаемый признак.

    Методы  факторного анализа дают возможность  вычленить наиболее типичные соотношения  ответов и выяснить степень их однотипности, агрегировать исходные данные, выделить группы связанных  параметров, выявить общие закономерности. Сущность факторного анализа заключается в замене большого числа признаков, описывающих объекты наблюдения, меньшим числом комплексных характеристик (факторов). Основной задачей, которую решают разнообразными методами факторного анализа, является сжатие информации, комплексное описание, переход от множества значений по m элементарным признакам с объемом информации n*m к ограниченному множеству элементов матрицы факторного отображения m*r или матрицы значений латентных факторов для каждого наблюдаемого объекта размерностью n*r, где r<m. 

6. Индивидуальные значения  факторов.

    Факторный анализ позволяет сохранить индивидуальные значения факторов. Они используются  для классификации объектов (не по исходным признакам, а по  общим факторам) и для построения уравнения регрессии на  эти  обобщенные показатели.   

7. Факторы как социологические  индексы. 

    Измерение латентной переменной в эмпирических социологических исследованиях  обычно происходит следующим образом. Социолог, понимая, что "лобовой" вопрос в анкете не работает, вместо него задает респонденту серию косвенных вопросов. Каждому из этих вопросов отвечает своя наблюдаемая переменная. Типы шкал всех таких переменных обычно считаются одинаковыми - номинальными или порядковыми. В случае номинальных шкал для получения значений латентной переменной используется техника логического квадрата (куба и т.д.). В случае порядковых шкал значение латентного признака для конкретного респондента чаще всего получается в результате суммирования ответов этого респондента на указанные вопросы (т.е. суммирования значений наблюдаемых переменных).

    Латентная переменная, измеренная подобным образом, называется социологическим индексом.

    Для того, чтобы строящийся социологический  индекс был корректен, необходимо ответить на следующие вопросы:

  1. существует ли одномерная латентная переменная, которую мы намереваемся измерить;
  2. те ли наблюдаемые переменные мы выбрали;
  3. какова форма связи наблюдаемых переменных с латентной (для избежания простого сложения значений наблюдаемых характеристик чаще всего используют процедуру взвешивания);
  4. каков тип шкалы, отвечающей построенному индексу?

    Основным  элементом модели, заложенной в факторном  анализе, является априорное предположение  о наличии латентных факторов, стоящих за наблюдаемыми переменными и объясняющих связи между последними.

    Фактор – это та латентная переменная, измерение которой является нашей целью. Наблюдаемые признаки - вопросы в анкете.

    В случае существования одномерной латентной  переменной и удачного подбора наблюдаемых признаков можно считать, что наблюдаемое поведение респондента объясняется действием латентной переменной. Другими словами связи между наблюдаемыми переменными объясняются действием латентного фактора. Это, в свою очередь, уточняется с помощью аксиомы локальной независимости: фиксация значения латентной переменной приводит к распадению связей между наблюдаемыми переменными.

    Итак, наличие связи между наблюдаемыми признаками является необходимым условием существования латентной переменной (фактора) и удачности выбора отражающих ее вопросов в анкете. Если такой связи нет - мы должны или отвергнуть гипотезу о существовании той переменной, измерение которой является нашей главной целью, или скорректировать систему рассматриваемых наблюдаемых признаков таким образом, чтобы связь появилась (скажем, отбросить признаки, не связанные с другими). 

8. Вращение матрицы  факторных нагрузок.

      Вращение  применяется для того, чтобы большие  нагрузки сделать еще больше, а  маленькие – еще меньше, т.е. чтобы  можно было с большей уверенностью зачислить переменную в тот или иной фактор. При этом мы получаем новые факторы в виде специального вида линейной комбинации имеющихся факторов. Существует три различных подхода к проблеме вращения:

  1. графический – в этом случае исходные переменные рассматриваются как точки в факторном пространстве, координаты которых равны нагрузкам на факторы, а размерность определяется числом факторов. Вращение в этом случае заключается в проведении новых осей, которые соответствуют некоторому критерию простой, легко интерпретируемой структуры. Если в факторном пространстве наблюдаются явные скопления точек, легко отделимые друг от друга, простая структура получается в том случае, когда оси проведены через эти скопления. Но если такое разделение не очевидно или число факторов велико, графический метод неприменим.
  2. задание априорной целевой матрицы – цель вращения в этом случае заключается в нахождении факторного отображения, наиболее близкого к некоторой заданной матрице.
  • можно задать значения нагрузок для каждой переменной, а затем проводить вращения с целью обеспечения минимального отличия полученной матрицы факторной структуры от заданной матрицы (в смысле критерия наименьших квадратов). При этом можно налагать дополнительные ограничения типа ортогональности. Этот вид вращения обычно применяется для анализа соответствия двух факторных структур.
  • в качестве целевой матрицы можно использовать некоторые    функции   от   ортогонального решения. Этот подход, известный под названием промакс - метода косоугольных  вращений, основан на том, что ортогональные вращения, как правило, близки к косоугольным. Сводя некоторые меньшие нагрузки к почти нулевым, можно получить пригодную для дальнейшего анализа целевую матрицу. Затем находятся косоугольные факторы, для которых расхождение вычислительной матрицы факторной структуры с целевой — минимально.
  • можно задать целевую матрицу, состоящую из нулей и единиц. Этот подход часто соответствует действительной степени информированности исследователя, когда ему известно только то, что некоторые нагрузки должны быть велики, а другие— малы.
  1. аналитический – в рамках данного подхода различают два вида вращений – ортогональное и косоугольное. Косоугольное вращение является более общим, чем ортогональное, так как здесь нет ограничений, связанных с некоррелированностью факторов. Преимущество косоугольного вращения состоит в том, что если в результате его выполнения получаются ортогональные факторы, можно быть уверенным, что эта ортогональность действительно им присуща, а не привнесена методом вращения. Однако на практике чаще прибегают к методам ортогонального вращения.

      Наиболее  часто используемыми методами ортогонального вращения являются:

  • квартимакс, который основан на вращении осей таким образом, чтобы результирующие факторные нагрузки максимизировали выражение:

                n     m

      Q = Σ Σ aij .

               i=1  j=1 

      На  практике, применяя этот критерий, можно  достичь простоту интерпретации  переменных за счет простоты интерпретации  факторов. Метод квартимакс имеет  тенденцию к выделению генерального фактора.

  • варимакс дает лучшее разделение факторов, так как упрощает описание столбцов факторной матрицы. Общая мера простоты задается в этом случае следующим критерием:

                             m       n            m     n

      V = 1/n2 (Σn Σaij - Σ (Σ aij2)2.

                            j=1     i=1        j=1   i=1 

  • эквимакс является обобщением двух предыдущих критериев, выглядит он следующим образом:

      αQ + βV = Maximum,

      где γ = m/2 = β /(α + β).

    Существуют  два подхода к косоугольному вращению — использование вторичных осей и первичной матрицы факторного отображения.

    1. Методы, основанные  на введении вторичных  осей (если существуют разделимые скопления точек, определяемые первичными факторами, то они будут иметь почти нулевые проекции на все вторичные оси, за исключением одной).

  • квартимин, сущность которого заключается в том, что если существуют разделимые скопления точек, то они будут иметь почти нулевые проекции на все вторичные оси, за исключением одной;
  • коваримин, который минимизирует ковариацию квадратов проекций на вторичные оси;

Информация о работе Методы многомерного статистического анализа