Индексы,выборка,корреляция

Автор работы: Пользователь скрыл имя, 03 Апреля 2012 в 21:11, курс лекций

Краткое описание

Индексы применяются для сравнения двух совокупностей, состоящих из элементов, непосредственно не поддающихся суммированию.

Индекс - это относительная величина, показывающая, во сколько раз уровень изучаемого явления в данных условиях отличается от уровня того же явления в других условиях.

Содержимое работы - 1 файл

Индексы, выборка, корреляция.doc

— 365.00 Кб (Скачать файл)

- генеральная средняя (среднее значение признака в генеральной совокупности)

              - выборочная средняя

Р- степень вероятности

t- коэффициент доверия

р- генеральная доля (доля единиц, обладающих данным значением признака в общем числе единиц генеральной совокупности)

w- выборочная доля

- генеральная дисперсия (дисперсия признака в генеральной совокупности)

S2- выборочная дисперсия

- среднее квадратическое отклонение в генеральной совокупности

S- среднее квадратическое отклонение в выборке

- средняя ошибка выборки (мю)

- предельная ошибка выборки

Для того, чтобы можно было бы по выборке сделать вывод о свойствах генеральной совокупности, выборка должна быть репрезентативной (представительной), т.е. достаточно полно представлять свойства генеральной совокупности.

Репрезентативность выборки может быть обеспечена только при объективности отбора данных.

Возможно 3 способа отбора:

       случайный отбор;

       отбор единиц по определенной схеме;

       сочетание первого и второго способа.

Случайный отбор осуществляется с помощью жеребьевки или по таблице случайных чисел.

Отбор единиц по определенной схеме (направленная выборка). Вся совокупность подразделяется на типы (районы) и проводится случайный или механический отбор из каждого типа (района).

Между характеристиками выборочной и генеральной совокупностей существует некоторое расхождение, которое называют ошибкой выборки.

Общая величина ошибки выборки складывается из ошибки регистрации и ошибки репрезентативности.

Ошибки регистрации свойственны любому статистическому наблюдению из-за несовершенства измерительных приборов, недостаточной квалификации наблюдателя, недостаточности подсчетов.

Ошибки репрезентативности присутствуют только при не сплошном наблюдении и представляют собой разницу между значением показателя, полученного при выборке, и генеральным параметром. Ошибки репрезентативности могут быть систематическими и случайными.

Систематические (тенденциозные) ошибки возникают из-за нарушения основного принципа выборки- принципа случайности.

Случайные ошибки возникают из-за недостаточно равномерного представления в выборочной совокупности различных категорий единий генеральной совокупности.

Формирование выборочных совокупностей производится различными способами:

       собственно-случайный отбор;

       механический отбор;

       типичный отбор с механической выборкой;

       многоступенчатая выборка;

       многофазная выборка;

       комбинирование выборочного наблюдения со сплошным;

       серийная выборка;

       малая выборка.

 

Собственно-случайный отбор дает лотерея или жеребьевка.

При механическом отборе определяют интервал (например, равный 10). По составленному списку отбирают каждый десятый номер.

Типический отбор с механической выборкой применяют тогда, когда совокупность неоднородна. Ее разбивают на группы (типы) и внутри этих групп производят механический отбор.

При многоступенчатой выборке типический отбор сочетают с несколькими стадиями (ступенями) отбора. При этом каждая стадия имеет свою единицу отбора. Например, при обследовании бюджетов семей рабочих: I стадия- распределение по отраслям; II стадия – распределение по предприятиям;  III стадия – отбор рабочих внутри предприятия; IV стадия – разбивка рабочих на квалификационных и неквалификационных. 

Многофазная выборка отличается от многоступенчатой тем, что на всех ступенях выборки сохраняется одна и та же единица отбора.

Примером комбинированной выборки может служить отбор серий из нескольких типических групп.

При серийной выборке проводят случайный отбор не отдельных единиц совокупности, а целых серий (гнезд). Внутри отобранных серий производится сплошное обследование всех единиц.

Под малой выборкой понимается такое выборочное наблюдение, исленность единиц которого не превышает 20.

 
 
 
 
 
 
 
 
Формулы расчета, используемые при выборочном наблюдении

 

 

При повторном отборе

При бесповторном отборе

Что показывает

Средняя ошибка выборки

 

 

Среднюю величину всех возможных расхождений выборочной и генеральной средней

Для средней

 

Для доли

 

 

Предельная ошибка

 

 

С определенной степенью вероятности                          (Р) отклонения выборочных характеристик от генеральных не превысят некоторой величины (предельной ошибки выборки)

Для средней

 

 

Для доли

Р=0,683,t=1

Р=0,954,t=2

Р=0,997,t=3

Численность выборки, n

 

 

Необходимую численность выборки

 

Для средней

 

 

Для доли

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Тема 8. Статистическое изучение связей между явлениями

 

Студент должен иметь представление

-    о функциональных и корреляционных связях.

Знать

-    основные виды уравнений, используемых при различных формах связи между двумя признаками.

Уметь:

-    выявлять наличие связи, ее характер и направление;

-   решать системы уравнений для определения их параметров;

-   определять тесноту связи с помощью коэффициента корреляции, эмпирического корреляционного отношения, индекса корреляции, коэффициента корреляции рангов.

Рассматривая зависимость между признаками, необходимо выделить две категории:

-   функциональную (полную) связь;

-   корреляционную (неполную) связь

При функциональной связи величине факторного признака строго соответствует одно или несколько значений функции. Это связь строгая, ее можно рассчитать по формуле.

При корреляционной связи каждому значению аргумента соответствуют случайно распределенные значения функции. Это связи неполные, проявляются не в каждом отдельном случае, а  лишь в массе      в среднем.

По своей форме корреляционные связи бывают:

-       прямые и обратные;

-       прямолинейные и криволинейные;

-       однофакторные и многофакторные.

Прямые и обратные связи различаются от направления изменения результативного признака. Если факторный признак растет, то растет и результативный. Это связь прямая (чем выше квалификация рабочего, тем выше производительность труда). Если факторный признак растет, а результативный снижается, то это связь обратная ( чем выше производительность труда, тем ниже себестоимость продукции)

Прямолинейные и криволинейные связи различаются в зависимости от функции, которой они выражаются: линейной (прямолинейная связь) или криволинейной -параболы, гиперболы, полулогарифмической кривой, показательной кривой (криволинейная связь).

  Однофакторной называется связь между одним факторным « одним результативным признаком (частная или парная корреляция).

Многофакторной называется связь между несколькими факторными и одним результативным признаком (множественная корреляция).

Основные виды уравнений, используемых при различных формах связи между двумя признаками

 

№ п/п

Уравнение

Система нормальных уравнений

1

2

3

1

Прямой

или

(связь прямолинейная)

 

2

Парабола второго порядка

или

у = а + вх+ сх2

(связь криволинейная)

 

3

Кубическая парабола

у x = а0 + а1 + аx +а3 х3

или

(связь криволинейная)

4

Гипербола

или

(связь криволинейная)

5

Логарифмическая кривая

или

(связь криволинейная)

 

Решая системы уравнений методом наименьших квадратов, определи параметры уравнения связи:

                 

Параметры а1 и а0 можно определить по формулам:

 

             

Параметр а0 - показывает усредненное влияние на результативный признак неучтенных (не выделенных для исследования) факторов.

Параметр a1 (коэффициент регрессии) показывает, насколько изменяется в среднем значение результативного признака при увеличении факторного на единицу

На основе этого параметра (коэффициента регрессии) вычисляются коэффициенты эластичности, которые показывают изменение результативного признака в % в зависимости от изменения факторного признака на 1 %

 

Коэффициент эластичности       

 

Эмпирический (перекрестный)

коэффициент эластичности                       где

 

Э - процентные изменения результативного показателя у при изменении х;

   - прирост фактора х

   - прирост результативного показателя у

 

 

 

 

             

 

 

 

 

             

 

 

 

                                         

 

 

 

 

 

 

 

Рис.1. Основные этапы проведения корреляционного анализа

 

 

 

 

 

 

 

 

Основные формулы для определения тесноты связи

 

№ п/п

Показатель

Формула расчета

Что показывает данная величина

1

2

3

4

1

Линейный коэффициент (при прямолинейной связи)

(если вычислен коэффициент регрессии а1 )

Тесноту связи от 0 до 1

R=0 – связь отсутствует

R=0,2-0,3 – связь слабая

R=0,4-0,5 – связь умеренная

R=0,6-0,7 – связь заметная

R=0,8-0,9 – связь сильная

R=1,0 – связь полная, функциональная

 

 

 

 

2

Эмпирическое корреляционное отношение (при криволинейной связи)

Тесноту связи от 0 до 1

3

Коэффициент детерминации (подкоренное выражение)

        D= * 100%

Долю вариации результативного признака под влиянием вариации признака- фактора

4

Множественный коэффициент корреляции

Тесноту связи от 0 до 1 между тремя факторами (x,y,z)

Информация о работе Индексы,выборка,корреляция