Автор работы: Пользователь скрыл имя, 24 Декабря 2012 в 09:35, контрольная работа
Статистические дисциплины играют важную роль в системе экономического образования. Для общеэкономических специальностей, статистика является основой для разработки и совершенствования методов экономического анализа. Сама же статистика - самостоятельная общественная наука, имеющая свой предмет и метод исследования. Понятие статистика происходит от латинского слова status, которое в переводе, означает - положение, состояние, порядок явлений. Эта наука, изучающая положение дел в государстве.
Введение
1 Основные понятия дисперсионного анализа.
2 Модели дисперсионного анализа.
2.1Случайная модель
2.2Детерминированная модель
2.3Смешанная модель
3 Формула разложения дисперсии
4 Дисперсионный анализ
4.1 Однофакторный анализ
4.2Двухфакторный анализ
Статистическая обработка результатов измерений
Заключение
Список литературы
ФЕДЕРАЛЬНОЕ АГЕНТСТВО ПО ОБРАЗОВАНИЮ
ГОСУДАРСТВЕННОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ
ВЫСШЕГО ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ
«ВОРОНЕЖСКИЙ ГОСУДАРСТВЕННЫЙ ТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ»
(ГОУВПО «ВГТУ»)
___________________Инженерно-
(факультет)
Кафедра__экономики и управления на предприятии машиностроении___
КУРСОВАЯ РАБОТА
по дисциплине «Теория вероятностей и математическая статистика».
Тема «Основы дисперсионного анализа».
Разработал(а) студент(ка) гр. Э-115 1234567890
Подпись, дата Инициалы, фамилия
Руководитель
Подпись, дата Инициалы, фамилия
Защищена ___________________ Оценка _____________________________
2012
Содержание
Введение
1 Основные понятия
2 Модели дисперсионного анализа.
2.1Случайная модель
2.2Детерминированная модель
2.3Смешанная модель
3 Формула разложения дисперсии
4 Дисперсионный анализ
4.1 Однофакторный анализ
4.2Двухфакторный анализ
Статистическая обработка результатов измерений
Заключение
Список литературы
Введение
Статистические дисциплины играют важную роль в системе экономического образования. Для общеэкономических специальностей, статистика является основой для разработки и совершенствования методов экономического анализа. Сама же статистика - самостоятельная общественная наука, имеющая свой предмет и метод исследования. Понятие статистика происходит от латинского слова status, которое в переводе, означает - положение, состояние, порядок явлений. Эта наука, изучающая положение дел в государстве. Главная её задача это сбор цифровых данных, их обобщение и переработка.
Математическая статистика – это наука, занимающаяся методами обработки экспериментальных данных, которая решает следующие задачи:
1) систематизировать полученный статистический материал;
2) на основании полученных экспериментальных данных оценить интересующие нас числовые характеристики наблюдаемой случайной величины;
3) определить число опытов, достаточное для получения достоверных результатов при минимальных ошибках измерения.
Одной из задач третьего типа является задача проверки правдоподобия гипотез. Она может быть сформулирована следующим образом: имеется совокупность опытных данных, относящихся к одной или нескольким случайным величинам. Необходимо определить, противоречат ли эти данные той или иной гипотезе, например, гипотезе о том, что исследуемая случайная величина распределена по определенному закону, или две случайные величины некоррелированы (т.е. не связаны между собой) и т.д. В результате проверки правдоподобия гипотезы она либо отбрасывается, как противоречащая опытным данным, либо принимается, как приемлемая. Таким образом, математическая статистика помогает экспериментатору лучше разобраться в полученных опытных данных, оценить, значимы или нет определенные наблюденные факты, принять или отбросить те или иные гипотезы о природе рассматриваемого явления.
3.
Дисперсионный анализ применяют для изучения влияния качественных признаков на количественную переменную. Например, пусть имеются k выборок результатов измерений количественного показателя качества единиц продукции, выпущенных на k станках, т.е. набор чисел (x1(j), x2(j), … , xn(j)), где j – номер станка, j = 1, 2, …, k, а n – объем выборки. В распространенной постановке дисперсионного анализа предполагают, что результаты измерений независимы и в каждой выборке имеют нормальное распределениеN(m(j), σ2) с одной и той же дисперсией. Хорошо разработаны и непараметрические постановки [19].
Проверка однородности качества продукции, т.е. отсутствия влияния номера станка на качество продукции, сводится к проверке гипотезы
H0: m(1) = m(2) = … = m(k).
В
дисперсионном анализе
Гипотезу Н0 проверяют против альтернативной гипотезы Н1, согласно которой хотя бы одно из указанных равенств не выполнено. Проверка этой гипотезы основана на следующем «разложении дисперсий», указанном Р.А.Фишером:
где s2 – выборочная дисперсия в объединенной выборке, т.е.
Далее, s2(j) – выборочная дисперсия в j-ой группе,
Таким образом, первое слагаемое в правой части формулы (7) отражает внутригрупповую дисперсию. Наконец, - межгрупповая дисперсия,
Область прикладной статистики, связанную с разложениями дисперсии типа формулы (7), называют дисперсионным анализом. В качестве примера задачи дисперсионного анализа рассмотрим проверку приведенной выше гипотезы Н0 в предположении, что результаты измерений независимы и в каждой выборке имеют нормальное распределение N(m(j), σ2) с одной и той же дисперсией. При справедливости Н0 первое слагаемое в правой части формулы (7), деленное на σ2, имеет распределение хи-квадрат с k(n-1) степенями свободы, а второе слагаемое, деленное на σ2, также имеет распределение хи-квадрат, но с (k-1) степенями свободы, причем первое и второе слагаемые независимы как случайные величины. Поэтому случайная величина
имеет распределение Фишера с (k-1) степенями свободы числителя и k(n-1) степенями свободы знаменателя. Гипотеза Н0 принимается, если F < F1-α, и отвергается в противном случае, где F1-α – квантиль порядка 1-α распределения Фишера с указанными числами степеней свободы. Такой выбор критической области определяется тем, что при Н1 величина F безгранично увеличивается при росте объема выборок n. ЗначенияF1-α берут из соответствующих таблиц [8].
Разработаны непараметрические методы решения классических задач дисперсионного анализа [19], в частности, проверки гипотезы Н0.
Статистическая обработка
Практическая часть
ИДЗ-19.1
а)Располагаем значения результатов эксперимента в порядке возрастания, то есть записываем вариационный ряд.
Таблица 1. Вариационный ряд
0,2 |
0,3 |
0,4 |
0,5 |
0,7 |
0,8 |
1 |
1,1 |
1,2 |
1,4 |
1,7 |
1,8 |
1,9 |
2,1 |
2,2 |
2,3 |
2,4 |
2,5 |
2,6 |
2,9 |
3,1 |
3,2 |
3,3 |
3,4 |
3,6 |
3,7 |
3,8 |
4,2 |
4,3 |
4,4 |
4,4 |
4,5 |
4,6 |
4,7 |
4,7 |
4,8 |
4,9 |
5 |
5,1 |
5,2 |
5,3 |
5,5 |
5,6 |
5,7 |
5,7 |
5,8 |
5,9 |
5,9 |
6 |
6,1 |
6,2 |
6,2 |
6,3 |
6,4 |
6,5 |
6,8 |
6,9 |
7 |
7,1 |
7,2 |
7,3 |
7,3 |
7,4 |
7,5 |
7,6 |
7,7 |
7,8 |
7,9 |
8,1 |
8,2 |
8,3 |
8,4 |
8,6 |
8,7 |
8,8 |
8,9 |
9 |
9,1 |
9,2 |
9,4 |
9,5 |
9,6 |
9,7 |
9,9 |
10 |
10,1 |
10,2 |
10,3 |
11 |
10,9 |
11,1 |
11,2 |
11,3 |
11,4 |
11,5 |
11,6 |
11,7 |
11,8 |
12 |
11,9 |
б) находим размах варьирования
ω=хmax-xmin=11,9-0,2=11,7;
По формуле h=, -число интервалов, вычисляем длин частичного интервала h=11,7/9=1,3. В качестве границы первого интервала выбираем значение xmin. Тогда границы следующих частичных интервалов вычисляем по формуле xmin+dh, d= от 1 до . Находим середины интервалов по формуле х’i=(xi +xi+1)/2. Подсчитываем число значений результатов эксперимента, попавших в каждый интервал, то есть находим частоты интервалов ni. После вычисляем относительные частоты Wi=ni/n, где n=100 и их плотности Wi/h. Все полученные результаты сводим в таблицу 2.
Таблица 2. Полученные результаты эксперимента.
номер частичного интервала li |
Границы интервала xi -xi+1 |
Середина интервала х’i=(xi +xi+1)/2 |
частота интервала ni |
относительная частота Wi |
плотность относительной частоты Wi/h. |
1 |
0,2-1,5 |
0,85 |
10 |
0,1 |
0,076923077 |
2 |
1,5-2,8 |
2,15 |
9 |
0,09 |
0,069230769 |
3 |
2,8-4,1 |
3,45 |
8 |
0,08 |
0,061538462 |
4 |
4,1-5,4 |
4,75 |
14 |
0,14 |
0,107692308 |
5 |
5,4-6,7 |
6,05 |
14 |
0,14 |
0,107692308 |
6 |
6,7-8 |
7,35 |
13 |
0,13 |
0,1 |
7 |
8-9,3 |
8,65 |
11 |
0,11 |
0,084615385 |
8 |
9,3-10,6 |
9,95 |
10 |
0,1 |
0,076923077 |
9 |
10,6-11,9 |
11,25 |
11 |
0,11 |
0,084615385 |
∑ |
_ |
_ |
100 |
_ |
_ |
в) Строим полигон частот и гистограмму относительных частот (рисунок 1 и рисунок 2 соответственно; масштабы на осях выбираем разные)
Рисунок 1. Полигон частот.
Рисунок 2.Гистограмма относительных частот.
Находим значения эмпирической
функции распределения F*(x)=nx
nx- число вариант, меньших х;
n-объем выборки;
Результаты сводим в таблицу 3.
Таблица 3. Значения эмпирической функции распределения.
F(0,2) |
0 |
F(1,5) |
0,1 |
F(2,8) |
0,19 |
F(4,1) |
0,31 |
F(5,4) |
0,44 |
F(6,7) |
0,6 |
F(8) |
0,71 |
F(9,3) |
0,82 |
F(10,6) |
0,92 |
F(11,9) |
1 |
Рисунок 4. График эмпирической функции распределения.
г) Находим выборочное среднее
Х=
и выборочную дисперсию
Dв= = – х2.
Для этого составляем расчетную таблицу 4.
Таблица 4.Расчетная таблица.
mi |
Границы интервала xi ;xi+1 |
Середина интервала х’i |
частота интервала ni |
ni*х’i |
(х’i)2 |
ni*(х’i)2 |
1 |
0,2-1,5 |
0,85 |
10 |
8,5 |
0,7225 |
7,225 |
2 |
1,5-2,8 |
2,15 |
9 |
19,35 |
4,6225 |
41,6025 |
3 |
2,8-4,1 |
3,45 |
8 |
27,6 |
11,9025 |
95,22 |
4 |
4,1-5,4 |
4,75 |
14 |
66,5 |
22,5625 |
315,875 |
5 |
5,4-6,7 |
6,05 |
14 |
84,7 |
36,6025 |
512,435 |
6 |
6,7-8 |
7,35 |
13 |
95,55 |
54,0225 |
702,2925 |
7 |
8-9,3 |
8,65 |
11 |
95,15 |
74,8225 |
823,0475 |
8 |
9,3-10,6 |
9,95 |
10 |
99,5 |
99,0025 |
990,025 |
9 |
10,6-11,9 |
11,25 |
11 |
123,75 |
126,563 |
1392,188 |
∑ |
_ |
_ |
100 |
620,6 |
_ |
4879,91 |