Корреляционно-регресионный анализ

Автор работы: Пользователь скрыл имя, 04 Октября 2011 в 00:19, лабораторная работа

Краткое описание

Проводились исследования влияния температуры на кислотность при производстве сыра «Майского». Результаты исследований представлены в таблице 1

Содержимое работы - 1 файл

оТЧЕТ ТЕМА 1 МОДЕЛИРОВАНИЕ.docx

— 203.59 Кб (Скачать файл)

     ТЕМА 1. РЕГРЕССИОННО-КОРРЕЛЯЦИОННЫЙ АНАЛИЗ 

     Проводились исследования влияния температуры на кислотность  при производстве сыра «Майского». Результаты исследований представлены в таблице 1.

     Таблица 1

Продолжительность использования, ч 1 2 2,6 3 4 5 6
Йодное  число 145 142 138 132 127 123 112

Требуется:

  1. представить результаты эксперимента графически в виде точечной диаграммы и сделать предположение о форме модели;
  2. найти коэффициенты модели методом наименьших квадратов;
  3. найти средние квадратические ошибки коэффициентов найденного эмпирического уравнения регрессии;
  4. построить 95 %-ные доверительные интервалы для коэффициентов уравнения регрессии;
  5. вычислить коэффициенты корреляции и детерминации;
  6. провести анализ исходных данных при помощи встроенных функций EXCEL. Сравнить полученные данные.
  7. подобрать математическую модель с использованием линий тренда в электронных таблицах EXCEL.
  8. Представим результаты эксперимента графически, в виде точечной диаграммы, т.е. построим корреляционное поле.

     Для этого выполним следующие действия:

    • выделим числовые данные в строках таблицы;
    • выберем в меню Вставка пункт Диаграмма; тип диаграммы – Точечная;
    • Подписываем название диаграммы и названия осей;
    • Размещаем диаграмму на текущем листе.

     В результате выполненных действий, корреляционное поле имеет вид: 

Рисунок 1 – Корреляционное поле

     По  расположению точек на корреляционном поле предположим, что точки группируются вокруг прямой линии, т.е. уравнение регрессии имеет линейный характер [1 с.8, 6 с. 231-236].

     Таким образом, уравнение модели будет  иметь вид:

  1. При заданном виде зависимости находим параметры  этой зависимости, т.е. коэффициенты b0 и b1. Для этого используем метод наименьших квадратов.

     Для удобства вычислений создается вспомогательная таблица 2 [1 c. 9]. В данную таблицу вносятся исходные данные и осуществляются расчеты, указанные в заголовках таблицы.

    Таблица 2

xi yi xi2 yi2 xi*yi xi+yi (xi+yi)2
1 145 1 21025 145 146 21316
2 142 4 20164 284 144 20736
2,6 138 6,76 19044 358,8 140,6 19768,36
3 132 9 17424 396 135 18225
4 127 16 16129 508 131 17161
5 123 25 15129 615 128 16384
6 112 36 12544 672 118 13924
23,6 919 97,76 121459 2978,8 942,6 127514,36
 

     Контроль  произведенных вычислений осуществляется по формуле 1.

(1)

     В нашем случае имеем:

127514,4=97,76+2*2978,8+121459=127514,4.

     Данные  взяты из последней строки таблицы 1 соответствующих столбцов.

     Для нахождения коэффициентов уравнения  b0 и b1 запишем систему нормальных уравнений (2):

(2)

     В нашем случае:

 

     Составленная  система уравнений решается методом  Крамера. Для этого составляются определители (3):

                     (3)

     Полученные  определители – это определители второго порядка, которые раскрываются по формуле: разность произведений элементов главной и побочной диагоналей. Например, первый определитель раскрывается по формуле (4):

(4)

Остальные определители раскрываются аналогично.

(5)

Для удобства вычислений создаем таблицу 3:

Таблица 3

n D Db0 Db1 b0 b1
7 127,36 19541,76 -836,8 153,437186 -6,57035176

     Таким образом, уравнение регрессии имеет  вид:

.

  1. Найдем средние квадратические ошибки коэффициентов полученного эмпирического уравнения регрессии. Для этого составляется таблица 4:

Таблица 4

xi yi ei=ŷi-yi ei2
         
         
В последней строке таблицы размещаются  суммы по каждому столбцу

     В 1-м и 2-м столбцах – исходные значения X и Y. В 3-м столбце – условные средние ŷi, которые рассчитываются по формуле , где b0 и b1 берутся из таблицы 3.

     В 4-м столбце определяется ei – случайное слагаемое, характеризующее влияние на переменную Y неучтенных в данной формуле ( ) переменных Xi и влияние неконтролируемых изменений условий эксперимента.

    В 5-м столбце – величина ei, возведенная во 2-ю степень.

     Результаты  вычислений представлены в таблице 5. 
 
 

Таблица 5

xi yi  
eii-yi ei2
1 145 146,8668342 1,866834171 3,48506982
2 142 140,2964824 -1,70351759 2,90197217
2,6 138 136,3542714 -1,64572864 2,70842277
3 132 133,7261307 1,726130653 2,97952703
4 127 127,1557789 0,155778894 0,02426706
5 123 120,5854271 -2,41457286 5,83016212
6 112 114,0150754 2,015075377 4,06052877
23,6 919 919 -1,8474E-13 21,9899497

     Еще одной характеристикой степени  тесноты служит несмещенная оценка дисперсии S2yx, характеризующая рассеивание экспериментальных точек относительно линии регрессии (6).

(6)

     Эмпирические  дисперсии точечных оценок коэффициентов  регрессии определяются по формуле (7):

   (7)

     В формулах (7) значения сумм берутся из последней строки таблицы 2. Результаты вычислений представлены в таблице 6.

Таблица 6

S2yx S2b0 S2b1
4,39798995 3,375844044 0,241723694

4) Для  построения 95 %-ных доверительных интервалов необходимо воспользоваться формулами (8) и (9):

    95 %-ный доверительный интервал для коэффициента b0:

(8)

    95 %-ный доверительный интервал для коэффициента b1:

(9)

     где b0 и b1 – коэффициенты модели, - коэффициент Стьюдента, S2b0 и S2b1 – соответствующие дисперсии точечных оценок (таблица 6).

     Коэффициент Стьюдента  находят по таблицам распределения Стьюдента [4], где число степеней свободы k определяется по формуле:

k=n-2, где n – количество опытов; a=0,05.

     В нашем случае .

     Итак, доверительные интервалы в нашем случае имеют вид:

    5) Вычислим коэффициенты корреляции  и детерминации.

Информация о работе Корреляционно-регресионный анализ