Использование дисперсионного анализа в методических исследованиях

Автор работы: Пользователь скрыл имя, 02 Июля 2013 в 15:04, курсовая работа

Краткое описание

Проникновение математических методов в самые разнообразные, подчас неожиданные сферы человеческой деятельности дает возможность пользоваться новыми, как правило, весьма плодотворными средствами исследования. Рост математической культуры специалистов в соответствующих областях приводит к тому, что изучение общих теоретических положений и методов вычислений уже не встречает серьезных трудностей. Вместе с тем на практике оказывается, что одних лишь математических познаний далеко не достаточно для решения той или иной прикладной задачи – необходимо еще получить навыки в переводе исходной формулировки задачи на математический язык. В этом и состоит проблема овладения искусством математического моделирования.

Содержание работы

Введение 4
Основная часть 5
2.1)Однофакторный дисперсионный анализ 6
2.2)Двухфакторный дисперсионный анализ 11
2.3)Многофакторный дисперсионный анализ 14
Задача для курсовой работы 18
3.1)Решение задачи для курсовой работы 20
Заключение 22
Список используемых источников 23

Скачать целиком (161.08 Кб) Сколько стоит заказать работу?

Содержимое работы - 1 файл

Титул курсовой работы.doc

— 335.50 Кб (Скачать файл)

Для случайной модели II слагаемое F_i в выражении (1) – величина случайная. Обозначая ее дисперсией

получим из (9)
(11)
и, как и в модели I
M( )= σ².

В таблице №1 представлен общий вид вычисления значений, с помощью дисперсионного анализа.
Таблица №1 – Базовая таблица дисперсионного анализа

Компоненты дисперсии	Сумма квадратов	Число степеней свободы	Средний квадрат	Математическое ожидание среднего квадрата
Межгрупповая		m-1	= Q₁/(m-1)
Внутригрупповая		mn-m	= Q₂/(mn-m)	M(S )= σ²
Общая		mn-1

Гипотеза H₀ примет вид σ_F² =0. В случае справедливости этой гипотезы
M( )= M( )= σ².
В случае однофакторного комплекса как для модели I, так и модели II средние квадраты S² и S², являются несмещенными и независимыми оценками одной и той же дисперсии σ².
Следовательно, проверка нулевой гипотезы H₀ свелась к проверке существенности различия несмещенных выборочных оценок S₂ и S дисперсии σ².
Гипотеза H₀ отвергается, если фактически вычисленное значение статистики

F = S /S больше критического F_α:K1:K2, определенного на уровне значимости α при числе степеней свободы k₁=m-1 и k₂=mn-m, и принимается, если F < F_α:K1:K2 .
F- распределение Фишера (для x > 0) имеет следующую функцию плотности (для = 1, 2, ...; = 1, 2, ...):

где - степени свободы;
Г   - гамма-функция.
Применительно к данной задаче опровержение гипотезы H₀ означает наличие существенных различий в качестве изделий различных партий на рассматриваемом уровне значимости.
Для вычисления сумм квадратов Q₁, Q₂, Q часто бывает удобно использовать следующие формулы:
                                                                (12)
                                                                                (13)
                                                                                  (14)
т.е. сами средние, вообще говоря, находить не обязательно.
Таким образом, процедура однофакторного дисперсионного анализа состоит в проверке гипотезы H₀о том, что имеется одна группа однородных экспериментальных данных против альтернативы о том, что таких групп больше, чем одна. Под однородностью понимается одинаковость средних значений и дисперсий в любом подмножестве данных. При этом дисперсии могут быть как известны, так и неизвестны заранее. Если имеются основания полагать, что известная или неизвестная дисперсия измерений одинакова по всей совокупности данных, то задача однофакторного дисперсионного анализа сводится к исследованию значимости различия средних в группах данных.

Двухфакторный дисперсионный анализ

Принимается аддитивная и независимая модель действия факторов:

, причем , . (15)

Величины a_j и b_i называются вкладами факторов. Последние два условия всегда можно выполнить масштабированием величин a_j и b_i за счет изменения величины c.

Для каждого наблюдения из рассматриваемой совокупности справедливо уравнение:

x_ij = c + a_j + b_i + e _ij, i =1, ..., n; j =1, ..., k. (16)

Обычно наблюдения представляют структурной таблицей статистического комплекса. Приведем простейший двухфакторный комплекс, в которой каждому сочетанию (A_j, B_j) уровней (градаций) факторов, т.е. одной клетке таблицы, соответствует одно наблюдение (в таблице сочетание символов “( )^” обозначает статистическую оценку групповых средних): Разложение результатов измерения при двухфакторном дисперсионном анализе представлены в таблице №2.

Таблица №2:

Фактор B

Фактор A
A₁ A₂ ... A_k

Средние по строкам
(оценки вкладов B)

B₁

B₂

...

B_n

x₁₁ x₁₂ ... x₁_k

x₂₁ x₂₂ ... x₂_k

...

x_n1 x_n2 ... x_nk

x₁_·=(c+b₁)^

x₂_·=(c+b₂)^

...

x_n_·=(c+b_n)^

Средние по столбцам
(оценки вкладов A)

x· ₁= x· ₂= x· _k=
(c+a₁)^ (c+a₂)^ (c+a_k)^

x· · =c^

Основное тождество дисперсионного анализа

Оценки c, b_i, a_j могут быть получены с помощью метода наименьших квадратов (МНК) минимизацией суммы (17)

Основываясь на МНК-оценках

, ,

, (18)

введем следующие обозначения:

для сумм квадратов отклонений под влиянием k уровней фактора А и n уровней фактора В:

, ; (19)

для остаточной суммы квадратов:

; (20)

для полной суммы квадратов наблюдений относительно общего среднего :

. (21)

Тогда справедливо следующее соотношение:

, (22)

т.е. полная сумма квадратов отклонений является суммой квадратов вкладов по факторам и квадратов случайных отклонений (или остатков ). Другими словами, полное рассеяние есть сумма вариации под влиянием факторов и случайной составляющей.

Проверка нулевых гипотез

По имеющимся наблюдениям требуется проверить предположение об отсутствии влияния фактора A (или B) на результат измерения, т.е. проверить гипотезы

H_A: a₁ = a₂ = . . . = a_k = 0

H_B: b₁ = b₂ = . . . = b_n = 0 .

Основой процедуры проверки гипотезы является сравнение двух статистически независимых оценок дисперсии s ².

Одна из них, s ^2* оценивает дисперсию вне зависимости от того, верна или нет гипотеза H_A (или H_В) и основана на сумме квадратов случайных отклонений:

. (23)

Другая, s ^2** оценивает дисперсию, если H_A (или H_В) верна. Для гипотезы H_A эта дисперсия основана на сумме квадратов разностей “между столбцами”, т.е. по уровням фактора A:

. (24)

Если гипотеза H_A верна, то отношение

(25)

имеет F-распределение Фишера с (k -1) и r степенями свободы. Если

F_A ³ F₁_-_a , (26)

где F₁_-_a – квантиль этого распределения порядка 1- a , a – выбранный уровень значимости, то гипотеза H_A отклоняется.

Вместо (5.54) можно использовать эквивалентную процедуру: гипотеза H_A отклоняется, если

P{ F ³ F_A } £ a, (27)

где P{ F ³ F_A } – вероятность при справедливости H_A получить значение, большее, чем F_A; F – случайная величина, имеющая распределение Фишера.

Для проверки гипотезы H_В используют сумму квадратов разностей "между строками", то есть по уровням фактора B: . (28)

Аналогичным образом, если отношение велико, то гипотеза H_B отклоняется.

Многофакторный дисперсионный анализ

Следует сразу же отметить, что принципиальной разницы между многофакторным и однофакторным дисперсионным анализом нет. Многофакторный анализ не меняет общую логику дисперсионного анализа, а лишь несколько усложняет ее, поскольку, кроме учета влияния на зависимую переменную каждого из факторов по отдельности, следует оценивать и их совместное действие. Таким образом, то новое, что вносит в анализ данных многофакторный дисперсионный анализ, касается в основном возможности оценить меж-факторное взаимодействие. Тем не менее, по-прежнему остается возможность оценивать влияние каждого фактора в отдельности. В этом смысле процедура многофакторного дисперсионного анализа (в варианте ее компьютерного использования) несомненно более экономична, поскольку всего за один запуск решает сразу две задачи: оценивается влияние каждого из факторов и их взаимодействие.
Общая схема двухфакторного эксперимента, данные которого обрабатываются дисперсионным анализом имеет вид:

Зависимая переменная x_i

Взаимодействие факторов A и B

Прочие не учитываемые (случайные) факторы

Фактор B:
3 уровня

Фактор А:
2 уровня

Рисунок 1.1 – Схема двухфакторного эксперимента
Данные, подвергаемые многофакторному дисперсионному анализу, часто обозначают в соответствии с количеством факторов и их уровней.
Предположив, что в рассматриваемой задаче о качестве различных m партий изделия изготавливались на разных t станках и требуется выяснить, имеются ли существенные различия в качестве изделий по каждому фактору:
А - партия изделий;
B - станок.
В результате получается переход к задаче двухфакторного дисперсионного анализа.
Все данные представлены в таблице №3, в которой по строкам - уровни A_i фактора А, по столбцам — уровни B_j фактора В, а в соответствующих ячейках, таблицы находятся значения показателя качества изделий x_ijk(i=1,2,...,m; j=1,2,...,l; k=1,2,...,n).
Таблица №3 – Показатели качества изделий

	B₁	B₂	…	B_j	…	B_l
A₁	x_11l,…,x_11k	x_12l,…,x_12k	…	x_1jl,…,x_1jk	…	x_1ll,…,x_1lk
A₂	x_21l,…,x_21k	x_22l,…,x_22k	…	x_2jl,…,x_2jk	…	x_2ll,…,x_2lk
…	…	…	…	…	…	…
A_i	x_i1l,…,x_i1k	x_i2l,…,x_i2k	…	x_ijl,…,x_ijk	…	x_jll,…,x_jlk
…	…	…	…	…	…	…
A_m	x_m1l,…,x_m1k	x_m2l,…,x_m2k	…	x_mjl,…,x_mjk	…	x_mll,…,x_mlk

Двухфакторная дисперсионная модель имеет вид:
x_ijk=μ+F_i+G_j+I_ij+ε_ijk, (29)
где x_ijk - значение наблюдения в ячейке ij с номером k;
μ - общая средняя;
F_i- эффект, обусловленный влиянием i-го уровня фактора А;
G_j - эффект, обусловленный влиянием j-го уровня фактора В;
I_ij - эффект, обусловленный взаимодействием двух факторов, т.е. отклонение от средней по наблюдениям в ячейке ij от суммы первых трех слагаемых в модели (29);
ε_ijk - возмущение, обусловленное вариацией переменной внутри отдельной ячейки.
Предполагается, что ε_ijk имеет нормальный закон распределения N(0; с²), а все математические ожидания F_*, G_*, I_i*, I_*j равны нулю.

Групповые средние находятся по формулам:
- в ячейке:
,
по строке:

по столбцу:

общая средняя:

В таблице №4 представлен общий вид вычисления значений, с помощью дисперсионного анализа.
Таблица №4 – Базовая таблица дисперсионного анализа

Компоненты дисперсии	Сумма квадратов	Число степеней свободы	Средние квадраты
Межгрупповая (фактор А)		m-1
Межгрупповая (фактор B)		l-1
Взаимодействие		(m-1)(l-1)
Остаточная		mln - ml
Общая		mln - 1

Проверка нулевых гипотез H_A, H_B, H_AB об отсутствии влияния на рассматриваемую переменную факторов А, B и их взаимодействия AB осуществляется сравнением отношений

, , (для модели I с фиксированными уровнями факторов) или отношений , , (для случайной модели II) с соответствующими табличными значениями F – критерия Фишера – Снедекора. Для смешанной модели III проверка гипотез относительно факторов с фиксированными уровнями производится также как и в модели II, а факторов со случайными уровнями – как в модели I.
Если n=1, т.е. при одном наблюдении в ячейке, то не все нулевые гипотезы могут быть проверены так как выпадает компонента Q₃из общей суммы квадратов отклонений, а с ней и средний квадрат , так как в этом случае не может быть речи о взаимодействии факторов.
С точки зрения техники вычислений для нахождения сумм квадратов Q₁, Q₂, Q₃, Q₄, Q целесообразнее использовать формулы:

Q₃= Q – Q₁ – Q₂ – Q₄.
Отклонение от основных предпосылок дисперсионного анализа — нормальности распределения исследуемой переменной и равенства дисперсий в ячейках (если оно не чрезмерное) — не сказывается существенно на результатах дисперсионного анализа при равном числе наблюдений в ячейках, но может быть очень чувствительно при неравном их числе. Кроме того, при неравном числе наблюдений в ячейках резко возрастает сложность аппарата дисперсионного анализа. Поэтому рекомендуется планировать схему с равным числом наблюдений в ячейках, а если встречаются недостающие данные, то возмещать их средними значениями других наблюдений в ячейках. При этом, однако, искусственно введенные недостающие данные не следует учитывать при подсчете числа степеней свободы.

Задача для курсовой работы

Информация о работе Использование дисперсионного анализа в методических исследованиях