Выборочное наблюдение в статистике. Корреляционно-регрессионный анализ

Автор работы: Пользователь скрыл имя, 21 Октября 2011 в 21:50, реферат

Краткое описание

Cтатистическое исследование может осуществляться по данным не сплошного наблюдения, основная цель которого состоит в получении характеристик изучаемой совокупности по обследованной её части. Одним из наиболее распространённых в статистике методов, применяющим не сплошное наблюдение, является выборочный метод. Под выборочным понимается метод статистического исследования, при котором обобщающие показатели изучаемой совокупности устанавливаются по некоторой её части на основе положений случайного отбора.

Содержимое работы - 1 файл

реферат статистика.docx

— 76.76 Кб (Скачать файл)

    Например, при n = 100 оно равно 1,01, а при n = 500 оно равно 1,002. Поэтому с определённой долей погрешности формулу расчёта средней ошибки выборки можно представить в следующем виде.

    

    Однако  следует иметь в виду, что данная формула применяется для определения  средней ошибки выборки лишь при  повторном отборе. Поскольку при  бесповторном отборе численность генеральной  совокупности N в ходе выборки сокращается, то в формулу для расчёта n средней ошибки выборки включают дополнительный множитель. Формула средней ошибки выборки принимает следующий вид:

    

    Для практики выборочных обследований важно, что средняя ошибка выборки применяется  для установления предела отклонений характеристик выборки из соответствующих  показателей генеральной совокупности. Лишь с определённой степенью вероятности можно утверждать, что эти отклонения не превысят величины t u, которая в статистике называется предельной ошибкой выборки.

    Предельная  ошибка выборки связана со средней  ошибкой выборки u отношением:

      

    При этом t как коэффициент кратности средней ошибки выборки зависит от вероятности, с которой гарантируется величина предельной ошибки выборки. Обычно в практике экономических исследований обычно ограничиваются значением t не превышающим двух трёх единиц.

    Значение  выборочного метода состоит в  том, что при минимальной численности  обследуемых единиц проведение исследования осуществляется в более короткие сроки и с минимальными затратами  труда и средств. Это повышает оперативность статистической информации, уменьшает ошибки регистрации.

    В проведении ряда исследования выборочный метод является единственно возможным, например, при контроле качества продукции (товара, услуги), если проверка сопровождается уничтожением или разложением на составные части обследуемых  образцов. 
 
 
 
 
 
 
 
 
 
 
 
 
 

 

     

    Корреляционно-регрессионный  анализ. 

    В исследованиях часто решают задачу выявления факторов, определяющих уровень  и динамику процесса. Такая задача чаще всего решается методами корреляционного  и регрессионного анализа. Для достоверного отображения объективно существующих процессов необходимо выявить существенные взаимосвязи и не только выявить, но и дать им количественную оценку. Этот подход требует вскрытия причинных  зависимостей. Под причинной зависимостью понимается такая связь между  процессами, когда изменение одного из них является следствием изменения  другого.

    Основными задачами корреляционного анализа  являются оценка силы связи и проверка статистических гипотез о наличии  и силе корреляционной связи. Не все  факторы, влияющие на процессы, являются случайными величинами, поэтому при  анализе явлений обычно рассматриваются  связи между случайными и неслучайными величинами. Такие связи называются регрессионными, а метод математической статистики, их изучающий, называется регрессионным анализом.

    Корреляционный  анализ и регрессионный анализ являются смежными разделами математической статистики, и предназначаются для  изучения по выборочным данным статистической зависимости ряда величин; некоторые  из которых являются случайными.

    Для аналитических целей корреляционную связь представляют при помощи математических функций, т.е. придают ей функциональную форму. Под формой связи понимают тенденцию, которая проявляется  в изменении результативного  признака в связи с изменением признака-фактора.

    Построение  и анализ корреляционной модели связи  осуществляются с помощью корреляционно-регрессионного анализа, который состоит из следующих  этапов:

  • предварительного априорного анализа;
  • сбора информации и ее первичной обработки;
  • построения модели (уравнения регрессии);
  • оценки и анализа модели.

    Все этапы связаны между собой, границы  их часто переплетаются и носят  условный характер.

    Форма корреляционной связи может быть выражена различными математическими  функциями. Выбор формы связи  решается на основе теоретического анализа  существа изучаемых явлений и  исследования эмпирических данных.

    Эмпирическое  исследование формы связи включает построение графиков корреляционных полей, эмпирических линий регрессии, а также анализ параллельных рядов. Изучение эмпирического материала дает возможность установить направление и форму связи.

    Для определения видов функции необходимо применять комплекс приемов: экономический, логический, графический и математический.

    Линейная  форма связи может быть выражена уравнением прямой:

    yх=a0+a1х

    Нелинейная  форма связи показана:

    1) уравнением параболы второго  порядка

    ух=a0+a1х+а2 х2

    2) уравнением гиперболы

    yх=a0+

    3) показательной функцией

    yх=a0+a1х

    4) степенной функцией

    yх=a0×

    и другими функциями.

    Главной проблемой при построении модели связи является определение вида аналитической функции, которая  отразит механизм связи между  факторным и результативным признаками и даст количественную оценку этой связи.

    Наиболее  часто для определения формы  корреляционной связи используют уравнение  прямой

    yх=a0+a1х

    где ух - теоретические значения результативного признака;

    х - факторный признак;

    а0 и а1, - параметры уравнения связи.

    Уравнением  связи называется уравнение регрессии, а анализ, производимый с помощью уравнения регрессии, называется регрессионным анализом.

    После установления вида функции для модели связи определяются параметры уравнения  регрессии а0 и а1. Параметры уравнения регрессии определяются методом наименьших квадратов, суть которого состоит в том, что теоретическая линия регрессии должна быть проведена так, чтобы сумма квадратов отклонений эмпирических данных от теоретических была величиной минимальной. Исчисляя первые производные по а0 и а1 от функции Σ(у -а0 –а1х)2 —> min и приравнивая их к нулю, получаем систему нормальных уравнений вида:

    

    

    Решая систему нормальных уравнений, определяем параметры а0 и а1 :

    

    

    

    Параметр  а1 называется коэффициентом регрессии и показывает изменения результативного признака при изменении факторного признака на единицу. Параметр а0 не имеет экономического содержания, так как может принимать отрицательные значения.

    Очень часто исследуемые признаки имеют  разные единицы измерения, поэтому  для оценки влияния факторного признака на результативный применяется коэффициент эластичности. Он вычисляется для каждой точки и в среднем для всей совокупности.

    Теоретический коэффициент эластичности вычисляют  по формуле:

      

    где - первая производная уравнения регрессии ух

    Средний коэффициент эластичности для уравнения  прямой вычисляется так:

    

    Коэффициент эластичности показывает, на сколько  процентов изменяется результативный признак при изменении факторного признака на один процент.

    Уравнение регрессии имеет практическое значение. Сравнивая фактический объем  продукции у отдельных предприятий  с теоретическим, мы получаем возможность его оценки с точки зрения средних условий существующих в данной совокупности предприятий. Регрессионную модель можно использовать для прогноза выпуска продукции в зависимости от изменения основных фондов тогда, когда не изменяются условия формирования уровней исследуемого признака.

    Измерение тесноты корреляционной связи. Важное место в анализе регрессионной модели занимает оценка тесноты корреляционной связи между изучаемыми признаками.

    Для измерения тесноты корреляционной связи между признаками при линейной форме связи применяется линейный коэффициент корреляции:

    

    Он  изменяется в пределах от -1 до +1 и  показывает тесноту и направление  корреляционной связи. Чем ближе  коэффициент корреляции к 1 (по модулю), тем связь теснее. Отрицательное  значение свидетельствует об обратной связи между признаками. Коэффициент  корреляции можно вычислять и  по формулам:

      

      

    При любой форме связи для измерения  тесноты корреляционной связи применяются  теоретическое корреляционное отношение и индекс корреляции. Теоретическое корреляционное отношение определяется по формуле:

      

    ,где  ή - теоретическое корреляционное отношение.

    Факторная дисперсия, характеризующая вариацию результативного признака под влиянием вариации признака-фактора определяется по следующей формуле:

    

    Общая дисперсия, характеризующая вариацию результативно- го признака под влиянием всех факторов, вызывающих эту вариацию, определяется по формуле

    

    Представим  индекс корреляции:

      

    Остаточная  дисперсия, характеризующая вариацию результативного признака под влиянием прочих неучтенных факторов, определяется по формуле

    

    Индекс  корреляции и теоретическое корреляционное отношение изменяются от 0 до 1 и показывают не только тесноту связи, но и степень  пригодности подобранных функций  связи.

    ή, R - называются коэффициентами детерминации, которые показывают долю вариации результативного признака под влиянием вариации признака-фактора. Коэффициент детерминации используют в качестве критерия оценки подбора наилучшей модели связи.

    Показатели  тесноты корреляционной связи используются не только для оценки уже построенной  модели связи (уравнения регрессии), но и для выбора оптимального варианта формы связи. Если теоретический  анализ не дает возможности дать однозначный  ответ о форме связи, то необходимо строить уравнения регрессии  с различными формами связи - линейные и нелинейные. Оценка пригодности  модели связи осуществляется путем  анализа коэффициента детерминации или индекса корреляции. Наилучшей  считается модель с наибольшими  значениями этих показателей. При линейной форме связи теоретическое корреляционное отношение и линейный коэффициент  корреляции равны.

    Первоначально исследования корреляции проводились  в биологии, а позднее распространились и на другие области, в том числе  на социально-экономическую. Одновременно с корреляцией начала использоваться и регрессия. Корреляция и регрессия тесно связаны между собой: первая оценивает силу (тесноту) статистической связи, вторая исследует ее форму. И корреляция, и регрессия служат для установления соотношений между явлениями и для определения наличия или отсутствия связи между ними

Информация о работе Выборочное наблюдение в статистике. Корреляционно-регрессионный анализ