Основная идея регрессионного анализа

Автор работы: Пользователь скрыл имя, 10 Апреля 2012 в 14:51, курсовая работа

Краткое описание

Для исследования взаимосвязи между величинами Х (вход) и y (выход) используются методы корреляционного и регрессионного анализа. Результаты корреляционного анализа позволяют сделать вывод о степени зависимости между переменными, а форма зависимости уточняется методами регрессионного анализа.

Содержание работы

1.1 Основная идея регрессионного анализа 4
1.2 Результаты эксперимента 9
2.1 СМО. Теоретическая часть 11
2.2 Задание 15
2.3 Граф системы 15
2.4 Уравнения Колмогорова 15
3 Список литературы 17

Содержимое работы - 1 файл

Курсовая.doc

— 270.00 Кб (Скачать файл)

Оглавление 

 

    1.1 Основная  идея регрессионного  анализа

      Для исследования взаимосвязи между  величинами Х (вход) и y (выход) используются методы корреляционного и регрессионного анализа. Результаты корреляционного анализа позволяют сделать вывод о степени зависимости между переменными, а форма зависимости уточняется методами регрессионного анализа.

      На  значение величины y оказывают влияние стохастические воздействия разного рода, поэтому форма связи между величинами Х и y определяется линией регрессии, показывающей, как в среднем изменяется величина  y при изменении входной величины Х, т.е. приходится говорить о связи средних значений величины y c X. Эту связь характеризуют условным математическим ожиданием величины y, вычисляемым при условии, что величина Х приняла определенное значение, а аппроксимирующая функция строится как функция регрессии.

      Задача  регрессионного анализа ставится следующим образом. Для каждого i-го опыта имеется набор значений (xi1,...,xik) входных параметров  
X1 Xk и соответствующее им значение выходного параметра yi.

      На практике пользуются следующей методикой определения значений коэффициентов b0, b1, ... , bk уравнения регрессии, которая дает возможность определить как значения коэффициентов, ("степень" их участия в "образовании" выходной величины), так и пригодность полученного уравнения для случаев зависимости любой степени.

      Если  фактор может принимать значения только (+1) и (-1) – верхний и нижний уровень (дробный факторный эксперимент), то соответствующую ему переменную X называют кодированной.

      Уравнения регрессии в кодированных переменных будет иметь следующий вид  для случая линейной связи:

для двух переменных:  y = b0 + b1X1 + b2X2                                      

для трех переменных:  y = b0 + b1X1 + b2X2 + b3X3                         

      Необходимо  отметить, что такой эксперимент  дает возможность определить коэффициенты, стоящие не только непосредственно при одиночных значениях факторов в уравнении регрессии, но и коэффициенты для компонент уравнения регрессии, отражающих взаимодействие различных факторов. Однако в таком случае модель не будет являться линейной, и уравнение регрессии в кодированных переменных будет иметь следующий вид, например:

для трех переменных:

     y=b0+b1X1+b2X2+b3X3+b12X1X2+b13X1X3+b23X2X3+b123X1X2 X3.

Общая схема проведения  расчетов

      Для проведения расчетов необходимо составить  карту проведения экспериментов (табл.6.2), которая является расширенной формой матрицы планирования экспериментов, и куда заносятся результаты поставленных опытов и рассчитанные значения некоторых статистических показателей.

      1. Рассчитывают построчные средние.

       ,

      где n - общее число экспериментов;

        m - число повторных опытов (серий).

    Пример  карты проведения экспериментов  для двух переменных.

    опыта

    Входы Выходы Построчные средние Построчные 

    дисперсии

    X1 X2 X1X2 y1 ... ym
    1 -1 -1 +1 y11 ... y1m
    2 +1 -1 -1 y21 ... y2m
    3 -1 +1 -1 y31 ... y3m
    4 +1 +1 +1 y41 ... y4m

 

      2. Определяются построчные дисперсии  (дисперсии воспроизводимости). Проверка  воспроизводимости осуществляется  с использованием критерия Кохрена  (Кочрена). Проверка воспроизводимости  является важнейшей предпосылкой, лишь при выполнении которой  результатам опытов и полученным на их основе закономерностям можно доверять.

      2.1. Определяются построчные дисперсии:

      2.2.Определяется  сумма построчных дисперсий:                                                

      2.3. Определяется максимальная из построчных дисперсий:

      2.4. Проверяется воспроизводимость  опытов по критерию Кохрена:                  

      2.5. Определяется табличное значение  критерия Кохрена Hтабл, выбираемое в зависимости от числа опытов n, числа повторных опытов (число серий) m, и уровня значимости p (надежности). Опыты считаются равноточными, если: H < Hтабл. В случае неравноточности опытов необходимо увеличить число повторных экспериментов или повысить их точность.

      3. Определяются коэффициенты уравнения регрессии.

      Индекс  любого коэффициента показывает компонент уравнения регрессии, множителем которого он является.

      В формулах суммирования у кодированной переменной первый индекс r - есть номер опыта (строки) в карте проведения эксперимента, второй индекс i - номер кодированной переменной. Например, - значение кодированной переменной в третьем опыте, равное, например, (+1) (см. табл.5.2).

      Коэффициент b0 по физическому смыслу соответствует опыту с поддержанием всех варьируемых факторов на средних (нулевых) уровнях.

      4. Определяется значимость коэффициентов  регрессии.

      Для этого требуется рассчитать следующие  показатели.

      4.1. Дисперсия эксперимента:

     ;

      4.2. Усредненная дисперсия эксперимента  с учетом повторности опытов:            

      4.3. Определяют дисперсию и среднюю  квадратичную ошибку коэффициентов  регрессии:

    

      4.4.  Определяется область значимости  значений коэффициентов регрессии: Db=±t*sb , где t - табличное значение критерия Стьюдента, выбираемое в зависимости от числа степеней свободы: f2=n*( m-1 ) и выбранного уровня значимости (обычно 0.05).

      4.5 Определяются значимые и незначимые коэффициенты в уравнении регрессии.

      Коэффициент - значим, если его абсолютная величина больше параметра Db, определяющего границы области значимости коэффициентов: , то есть коэффициент должен быть больше ошибки его определения, взятой с определенным запасом.

      После того как выявлены все значимые и  незначимые коэффициенты уравнения  регрессии, можно выписать в явном  виде собственно уравнение регрессии. Для этого удаляются все незначимые компоненты уравнения регрессии, определяя тем самым уравнение регрессии в кодированных переменных с полученным численными значениями значимых коэффициентов. При необходимости перехода от кодированных переменных к натуральным, следует подставить в полученное уравнение соотношения связи между этими переменными.

 

    1.2 Результаты эксперимента

Вариант 5              
                 
Х1   изменяется в диапазоне от 0 до +5        
Х2   изменяется в диапазоне от -2 до +5        
Х3   изменяется в диапазоне от -5 до +5        
                 
                 
0 Х1              
-2 Х2         Y 42,588  
-5 Х3              
                 
                 
                 
Окончательный вид уравнения регрессии        
y=-15,6532+0,9479*x1+2,0625*x2-4,9754*x3+1,9914*x1*x2-2,8523*x2*x3+3,5029*x1*x3
                 
            y= 42,954  
u1 u2 u3 u1*u2 u1*u3 u2*u3 u1*u2*u3
1 1 1 1 1 1 1
1 1 -1 1 -1 -1 -1
1 -1 1 -1 1 -1 -1
1 -1 -1 -1 -1 1 1
-1 1 1 -1 -1 1 -1
-1 1 -1 -1 1 -1 1
-1 -1 1 1 -1 -1 1
-1 -1 -1 1 1 1 -1

 
    Опыты        
1 2 3 4 5 yср s2
4,982 4,721 3,853 3,695 5,370 4,524 0,525453
108,504 108,586 110,137 109,208 109,692 109,225 0,494773
-167,734 -166,588 -167,053 -167,262 -167,753 -167,278 0,239828
113,751 112,874 112,491 112,238 112,422 112,755 0,363355
64,673 65,089 64,644 64,435 64,521 64,672 0,06336
-29,906 -30,671 -30,035 -29,567 -30,322 -30,100 0,175354
-37,986 -37,465 -37,974 -36,247 -36,558 -37,246 0,649078
43,513 42,615 42,664 42,637 43,287 42,943 0,180339
          12,437 0,336
          макс 0,649078

Информация о работе Основная идея регрессионного анализа