Автор работы: Денис Долговский, 15 Ноября 2010 в 20:12, контрольная работа
Целью исследования часто является установление количественной зависимости выходного параметра какого-либо процесса от одного или группы входных факторов в условиях колеблемости значений входных и выходных параметров, обусловленной влиянием случайных и в большинстве своем не поддающихся учету факторов.
Если взаимосвязь между двумя переменными величинами выражается некоторой функцией y = f (х), то в математическом анализе такая зависимость называется функциональной. Это значит, что в соответствии с видом функции каждому значению независимой переменной х отвечает одно или несколько вполне определенных значений зависимой переменной у.
1.Парная корреляция 2
2.Множественная корреляция 5
3.Полный факторный эксперимент (ПФЭ) 6
Задача №1 11
Задача №2 14
Задача №3 17
выполняется, то нулевая гипотеза принимается. При несоблюдении условия (1.17) принимается альтернативная гипотеза Н1: ¹ 0. В случае принятия нуль-гипотезы незначимый коэффициент исключается из уравнения регрессии, а величины оставшихся коэффициентов находят заново, так как между ними существует корреляционная зависимость (1.8).
Средние квадратичные ошибки коэффициентов линейной регрессии для проверки условия (1.17) находят по формулам
(1.18)
(1.19)
где Soст – корень квадратный из остаточной дисперсии или дисперсии уi относительно линии регрессии.
Остаточную дисперсию вычисляют по формуле
(1.20)
где – величины, вычисленные по уравнению регрессии; l – число учитываемых признаков в уравнении регрессии (для линейной регрессии l = 2); f = п – l – число степеней свободы. Если коэффициент корреляции r уже вычислен, то при выполнении практических расчетов удобно использовать связь между линейной корреляцией и линейной регрессией. В этом случае для нахождения остаточной дисперсии можно использовать формулу
(1.21)
Другим важным элементом регрессионного анализа является проверка адекватности уравнения регрессии по критерию Фишера. В этом случае проверяется нуль-гипотеза H0 : s2 = , т.е. предполагается, что генеральные дисперсии адекватности и воспроизводимости равны. Поскольку проверка осуществляется путем сравнения выборочных дисперсий, то нуль-гипотеза принимается при выполнении условия
(1.22)
где – выборочная дисперсия адекватности; – выборочная дисперсия воспроизводимости; f1 = fад – число степеней свободы ; f2 = fвоспр – число степеней свободы .
При повторении (дублировании) каждого из n опытов m раз дисперсия адекватности и воспроизводимости вычисляют по формулам
(1.23)
(1.24)
где n – объем выборки; m – число дублирующих опытов; l – число коэффициентов в уравнении регрессии; – значения, вычисленные по уравнению регрессии для xi, n – l = f1; n(m – 1) = f2.
В случае невозможности проведения дублирующих опытов и определения дисперсии воспроизводимости вместо соотношения (1.22) для оценки адекватности уравнения регрессии используют «обратное» отношение дисперсий:
(1.25)
где f1 = n – 1; f2 = n – l.
В
выражении (1.25)
находят по формулам (1.20)–(1.21), а дисперсию
относительного среднего
– по формуле (1.13). Считают, что эффективность
уравнения регрессии тем выше, чем больше
F превышает
.
2. МНОЖЕСТВЕННАЯ КОРРЕЛЯЦИЯ
Представления, изложенные в предыдущих разделах этой главы, можно распространить и на случай, когда исследуют линейную связь между многими признаками или параметрами объекта исследования. В общем случае зависимость между k + 1 переменными можно представить в форме выборочного уравнения множественной регрессии:
(2.1)
При k = 1 уравнение описывает линию регрессии, при k = 2 – плоскость, а при k > 2 – гиперплоскость. Реализация метода регрессионно-корреляционного анализа при k > 2 требует выполнения весьма трудоемких в «ручном» варианте вычислительных работ. Тем не менее многие практические задачи, связанные с регрессионно-корреляционным анализом зависимости 5–6 переменных (k = 4–5), могут быть успешно решены с применением широко используемых программируемых микрокалькуляторов.
Для реализации метода множественного регрессионно-корреляционного анализа при k > 2 удобно перейти от натурального масштаба признаков к безразмерному. Такой переход осуществляется нормированием всех значений случайных величин по формулам вида
(2.2)
i = 1, 2, 3, …, n; j = 1, 2, 3, …, k,
где Yi, Xji – нормированные значения соответствующих переменных (или признаков) y и xj; и – средние значения признаков; Sy и – средние квадратичные отклонения признаков.
В новом масштабе
; ; ; Sy = 1. (2.3)
В новых переменных уравнение регрессии не имеет свободного члена и принимает вид:
(2.4)
Коэффициенты
уравнения регрессии
(2.5)
где и – выборочные (простые) коэффициенты корреляции для нормированных величин, определяемые по формулам:
(2.6)
l, m = 1, 2, 3, …, k.
Вычисленные
по формулам (2.6) коэффициенты парной корреляции
равны соответствующим
В результате системы уравнений (2.5) получаем коэффициенты зависимости (2.4). Коэффициент корреляции R, характеризующий силу связи при множественной корреляции, определяют с использованием простых коэффициентов корреляции и коэффициентов уравнения регрессии (2.6) по формуле
(2.7)
Проверку гипотезы H0: R* = 0, т.е. значимости множественного коэффициента корреляции, можно осуществить по критерию Фишера:
(2.8)
где l – число признаков, учитываемых в анализе (в данном случае l = k + 1); f1 = l – 1; f2 = n – l. Если условие (2.8) не выполняется, то нуль-гипотеза отвергается и принимается альтернативная гипотеза о значимом отличии R от нуля и наличии зависимости между анализируемыми факторами. Значения F-критерия принимаются по данным Приложений 5 и 6.
Переход от уравнения (2.6) к уравнению регрессии в натуральном масштабе выполняется по формулам
j = 1, 2, …, k. (2.9)
Проверка
адекватности уравнения регрессии аналогична
изложенной в п.1 (условие (1.25)).
3.
ПОЛНЫЙ ФАКТОРНЫЙ
ЭКСПЕРИМЕНТ (ПФЭ)
3.1.
Введение в ПФЭ
Как
правило, при построении экспериментально-
Активный эксперимент по сравнению с пассивным характеризуется более высокой трудоемкостью и необходимостью привлечения соответствующих материальных и энергетических ресурсов. Однако постановка активного эксперимента обеспечивает достижение следующих преимуществ в экспериментальных исследованиях:
а) активный эксперимент позволяет продублировать опыты, что необходимо для всестороннего статистического анализа их результатов, выявления грубых ошибок и их компенсации;
б) за счет надлежащей организации активного эксперимента в него можно вовлечь меньшее число факторов, следовательно, искомая математическая модель объекта исследования получается более компактной;
в) в процессе активного эксперимента можно выбрать достаточно широкие интервалы варьирования факторов, в результате чего повысить точность определения коэффициентов математической модели.
Особое значение имеет специальная (оптимальная) организация активного эксперимента.
Значение входного фактора, задаваемое в активном эксперименте называют обычно уровнем варьирования входного фактора. При варьировании k факторов на двух уровнях выбираемых по различным сторонам от значения xi = 0, модель объекта получают в виде:
. (3.1)
В уравнении (3.1) члены, содержащие один фактор отражают линейные эффекты воздействия факторов. Члены, содержащие два фактора, отражают эффекты их двойного взаимодействия или двойные эффекты и т.д. Общее число членов уравнения (3.1) составляет 2k, включая свободный член.
Для оценки коэффициентов уравнения (3.1) также обрабатывают опытные данные по объекту, используя метод наименьших квадратов (МНК). Представим уравнение (3.1) в виде:
, (3.2)
где . Учитывая, что количество неизвестных коэффициентов составляет 2k, то минимальное количество опытов для их определения будет N = 2k.
Варьируя k факторов на двух уровнях варьирования, получим N = 2k неповторяющих комбинаций значений факторов или N опытов. Подставляя в N комбинаций значений факторов уравнении (3.2), получим в матричной форме соотношение:
(3.3)
в котором
(3.4)
является матрица-столбец расчетных (модельных) значений выхода;
(3.5)
структурная матрица факторов;
(3.6)
матрица-столбец искомых коэффициентов.
Если оцениваются все из возможных коэффициентов, матрица (3.5) имеет размер N(m + 1). В ее составе подматрица
(3.7)
является матрицей плана эксперимента, поскольку в качестве своих элементов содержит значения факторов х1, …, хk в отдельных опытах 1, …, N.
В выражениях (3.4)-(3.7) k – число факторов, m – (k + 1) – число нелинейных членов уравнения (3.2), х0 = 1 – фиктивная переменная (первый столбец элементов матрицы (3.5), m + 1 = N – максимальное число оцениваемых коэффициентов; N = m +1 - число опытов.
Матрица экспериментальных значений выхода имеет вид:
(3.8)
Если каждый опыт повторяли П раз, то элементы матрицы (3.6) представляют собой средние арифметические результаты параллельных опытов и .
Напомним, что на основании принципов МНК наиболее вероятные оценки b-коэффициентов находятся из условия минимизации остаточной суммы квадратов:
, (3.9)
где символ «т» здесь и ниже обозначает транспонирование матрицы.
Продолжая процедуру МНК, получим:
, (3.10)
где – дисперсионная матрица.
Если уровни варьирования факторов выбраны произвольно, то определение матрицы [D] представляет большие трудности. Предельное упрощение процедуры вычислений матрицы [B] достигается ортогонализацией плана экспериментов, что практически осуществляется варьированием факторов на равностоящих от центра плана уровнях.
Если ввести дополнительное условие, согласно которому в отдельных опытах придавать элементам подматрицы плана (3.7) значения хij = +1 или хij = –1, то формула (3.10) сводится к более простому выражению, согласно которому любой из искомых b-коэффициентов