Парная регрессия на основе метода наименьших квадратов и метода группировок

Автор работы: Пользователь скрыл имя, 02 Декабря 2010 в 19:28, реферат

Краткое описание

Простейшей системой корреляционной связи является линейная связь между двумя признаками – парная линейная корреляция.
Практическое значение ее в том, что есть системы, в которых среди всех факторов, влияющих на результативный признак, выделяется один важнейший фактор, который в основном определяет вариацию результативного признака. Измерение парных корреляций составляет необходимый этап в изучении сложных, многофакторных связей.

Содержимое работы - 1 файл

ПАРНАЯ РЕГРЕССИЯ НА ОСНОВЕ МЕТОДА НАИМЕНЬШИХ КВАДРАТОВ И МЕТОДА ГРУППИРОВОК.docx

— 57.01 Кб (Скачать файл)

     ПАРНАЯ  РЕГРЕССИЯ НА ОСНОВЕ МЕТОДА НАИМЕНЬШИХ КВАДРАТОВ И МЕТОДА ГРУППИРОВОК

     Простейшей  системой корреляционной связи является линейная связь между двумя признаками – парная линейная корреляция.

     Практическое  значение ее в том, что есть системы, в которых среди всех факторов, влияющих на результативный признак, выделяется один важнейший фактор, который в  основном определяет вариацию результативного  признака. Измерение парных корреляций составляет необходимый этап в изучении сложных, многофакторных связей. Есть такие системы связей, при изучении которых следует предпочесть  парную корреляцию. Внимание к линейным связям объясняется ограниченной вариацией  переменных и тем, что в большинстве  случаев нелинейные формы связей для выполнения расчетов преобразуются  в линейную форму.

     Парная  регрессия характеризует связь  между двумя признаками – результативными  и факторными. Аналитическая связь  между ними описывается следующими уравнениями:

    • прямой – ;
    • гиперболы –
    • параболы т. д.;

     Определить  тип уравнения можно, исследуя зависимость  графически. Однако существуют более  общие указания, позволяющие выявить  уравнение связи, не прибегая к графическому изображению. Если результативный и факторный признаки возрастают одинаково, примерно в арифметической  прогрессии, то это свидетельствует о том, что связь между ними линейная, а при обратной связи – гиперболическая. Если факторный признак увеличивается в арифметической прогрессии, а результативный – значительно быстрее, то используется связь параболическая или степенная.

     Параметры для всех уравнений связи чаще всего определяются из так называемой системы нормальных уравнений, отвечающих требованию метода наименьших квадратов (МНК). Это требование можно записать как или при линейной зависимости как , т.е. требуется определить, при каких значениях параметров и сумма квадратов отклонений эмпирических (фактических) значений результативного признака от теоретического будет минимальной. Найдя частные производные указанной суммы по и и приравняв их к нулю, легко записать систему уравнений, решение которой и дает параметры искомой функции, т.е. уравнения регрессии.

     Так система нормальных уравнений при  линейной зависимости имеет вид: 

 

где – объем исследуемой совокупности (число единиц наблюдений).

     На  практике часто исследования проводятся по большому числу наблюдений. В  этом случае исходные данные удобнее  представлять в свободной корреляционной таблице. При этом анализу подвергаются сгруппированные данные и по факторному x, и по результативному признакам y, т.е. уравнение парной регрессии целесообразно строить на основе сгруппированных данных.

     Если  значения признаков x и y заданы в определенных интервалах (a;b), то для каждого интервала сначала определяют середину интервала , а затем уже коррелируют значения и и строят уравнение регрессии между ними.

     Если  связь между признаками криволинейная и описывается уравнением параболы второго порядка, то 

. 

     В данном случае задача сводится к определению  неизвестных параметров: a0, a1, a2.

     Значения  величин x и y представлены двумя рядами данных:

     Если  бы все значения, полученные по данным наблюдении, лежали строго на кривой, описываемой уравнением параболы, или для каждой из точек было бы справедливо равенство: 

 

то не существовало бы никаких проблем. Однако на практике имеем другое: 

 

где   – разность между данными наблюдения и данными, полученными по уравнению связи.

       Эта разность как раз и появляется  из-за ошибок упрощения, поэтому  возникает проблема нахождения  таких коэффициентов уравнения,  при которых ошибка была бы  минимальной. Можно минимизировать  сумму абсолютных отклонений (ошибок), т.е. 

 

или минимизировать сумму кубических ошибок, и тогда  получим метод наименьших кубов: 

 

или, наконец, минимизировать наименьшую абсолютную ошибку: 

 

     Однако  наиболее оптимальным вариантом  является оценка ошибки по методу наименьших квадратов: 

 

     Метод наименьших квадратов обладает тем  замечательным свойством, что делает число нормальных уравнений равным числу неизвестных коэффициентов. Приведенное уравнение параболы второго порядка имеет три  неизвестных коэффициента a0, a1, a2.

     Следовательно, применяя метод наименьших квадратов, мы получим: 

 

     Для нахождения значений неизвестных коэффициентов, при которых функция была бы минимальной, необходимо приравнять частные производные по этим величинам к нулю. После простейших преобразований, получим систему нормальных уравнений: 

 

     Решив систему, найдем значения неизвестных  коэффициентов a0, a1, a2 и получим уравнение регрессии.

     Оценка  обратной зависимости между двумя признаками, когда с увеличением (уменьшением) факторного признака x уменьшается (увеличивается) результативный признак y, может быть осуществлена на основе уравнения гиперболы: 

. 

     Систему нормальных уравнений для нахождения параметров гиперболы можно представить  следующим образом: 

 

     Применение  метода наименьших квадратов объясняется неизбежным наличием случайных ошибок в результатах опыта.

     Решение вопроса о возможности использования  метода наименьших квадратов для  изучения связей между социально-экономическими явлениями зависит от свойства оценок, получаемых с помощью этого метода.

     Даже  при сравнительно небольшом числе  наблюдений применение метода наименьших квадратов позволяет получить достоверные  оценки.

Информация о работе Парная регрессия на основе метода наименьших квадратов и метода группировок