Автор работы: Пользователь скрыл имя, 01 Апреля 2012 в 19:26, реферат
Историю статистики как науки о статистических выводах обычно начинают с забавного эпизода, изложенного Ж. Бертраном в предисловии к его курсу «Исчисление вероятностей»: « Однажды в Неаполе преподобный Голиаци увидел человека из Базиликаты, который, встряхивая 3 игральные кости в чашке, держал пари, что выбросит 3 шестерки… Вы скажете, такая удача возможна. Однако человеку из Базиликаты это удалось во второй раз, и пари повторилось. Он клал кости назад в чашку 3,4,5 раз и каждый раз выбрасывал 3 шестерки. «Черт возьми,- вскричал преподобный, - кости налиты свинцом!» И так оно и было».
Введение…………………………………………………………………… 2
1. Задачи математической статистики…………………………………… 3
2. Математическая статистика. Основные понятия…………………..... 4
2.1. Генеральная и выборочная совокупности…………………………. 4
2.2. Повторная и бесповторная выборки. Репрезентативная выборка.. 5
2.3. Способы отбора………………………………………………………. 6
2.4. Статистический ряд, полигон частот и гистограмма……………… 9
2.5. Статистические гипотезы……………………………………….. 12
2.6. Критерий Пирсона (хи-квадрат)……………………………….. 14
2.7. Линейная корреляция………………………………………………… 22
Заключение………………………………………………………………… 31
Список литературы………………………………………………………… 32
Назовем условным средним среднее арифметическое значений случайной величины , соответствующих значению .
Уравнение называют уравнением регрессии на ; функцию называют регрессией на , а ее график - линией регрессии.
Если функция регрессии известна, то можно по значению одной случайной величины прогнозировать значение другой случайной величины. Корреляция называется линейной, если линия регрессии является прямой, т. е. .
Ломаная, соединяющая точки , называется эмпирической (опытной) линией регрессии. Если точки располагаются около некоторой прямой, то в качестве уравнения теоретической линии регрессии берется , где коэффициенты находятся по формулам:
; , определен ниже). (7)
Рис. 6
Ковариацией двух случайных величин и называется числовая характеристика
.
Коэффициентом корреляции между случайными величинами и называется безразмерная величина
; (8)
где и - средние квадратические отклонения величин и .
Коэффициент корреляции характеризует степень тесноты линейной зависимости между случайными величинами и , при этом связь тем теснее, чем ближе к единице ( ). Применяется таблица Чеддока для характеристики тесноты связи между случайными величинами и :
Диапазон измерения выборочного |
Характер тесноты |
0,1-0,3 0,3-0,5 0,5-0,7 0,7-0,9 0,9-0,99 |
слабая умеренная заметная высокая линейная |
Если , то при возрастании одной случайной величины другая имеет тенденцию в среднем возрастать. Если , то при возрастании одной случайной величины другая имеет тенденцию в среднем убывать.
Если , то линейная корреляционная связь отсутствует, и случайные величины называются некоррелированными. Если , то связь между случайными величинами и достаточно вероятна.
Чтобы сделать обоснованные выводы о тесноте зависимости между случайными величинами и по опытным данным, нужно установить значимость коэффициента корреляции, т. е. проверить нулевую гипотезу о том, что .
По опытным данным вычисляют критерий проверки
. (9)
При заданном уровне значимости и числу степеней свободы находят критическое значение для двусторонней критической области по таблице Стьюдента (смотрите таблицу прил. 3).
Если , то выдвинутую гипотезу принимают, т. е. выборочный коэффициент незначим, а случайные величины и некоррелированы.
Если - гипотезу отвергают, т. е. выборочный коэффициент корреляции значимо отличается от нуля, а случайные величины коррелированны.
Пример 4. Вычислить выборочный коэффициент корреляции , проверить его значимость и найти уравнение линии регрессии.
|
| ||||||
16,5-19,5 |
19,5-22,5 |
22,5-25,5 |
25,5-28,5 |
28,5-21,5 |
31,5-34,5 |
34,5-37,5 | |
97,5-102,5 |
6 |
3 |
1 |
||||
102,5-107,5 |
4 |
3 |
2 |
||||
107,5-112,5 |
6 |
5 |
2 |
||||
112,5-117,5 |
1 |
6 |
3 |
||||
117,5-122,5 |
2 |
3 |
9 |
2 |
1 | ||
122,5-127,5 |
5 |
7 |
3 |
||||
127,5-132,5 |
1 |
4 |
4 |
||||
132,5-137,5 |
1 |
5 |
1 |
||||
137,5-142,5 |
2 |
4 |
4 |
Решение. Найдем условные средние, соответствующие значению , по формуле . Тогда ; и т. д.
Составим корреляционную таблицу:
|
18 |
21 |
24 |
27 |
30 |
33 |
36 |
|
|
100 |
6 |
3 |
1 |
10 |
19,5 | ||||
105 |
4 |
3 |
2 |
9 |
29,4 | ||||
110 |
6 |
5 |
2 |
13 |
26,1 | ||||
115 |
1 |
6 |
3 |
10 |
27,6 | ||||
120 |
2 |
3 |
9 |
2 |
1 |
17 |
29,5 | ||
125 |
5 |
7 |
3 |
15 |
29,6 | ||||
130 |
1 |
4 |
4 |
9 |
30,7 | ||||
135 |
1 |
5 |
1 |
7 |
30,0 | ||||
140 |
2 |
4 |
4 |
10 |
33,6 | ||||
|
6 |
3 |
11 |
24 |
35 |
16 |
5 |
100 |
Контроль расчетов: - объем выборки.
Для построения эмпирической линии регрессии точки , ,…, соединим ломаной линией.
0
Рис. 7
Для нахождения выборочного коэффициента линейной корреляции найдем
;
.
Вспомогательно найдем:
;
;
.
Тогда
.
.
Определим ковариацию между и по формуле
.
Находим коэффициент корреляции по формуле (8):
.
Имеем , следовательно, связь между случайными величинами и достаточно вероятна.
Для проверки значимости коэффициента корреляции проверим нулевую гипотезу ; конкурирующая гипотеза .
Найдем по опытным данным величину
.
Найдем критическое значение по таблице критерия Стьюдента (прил. 3) при уровне значимости и числе степеней свободы . Тогда , поэтому гипотезу отвергаем и принимаем гипотезу , т. е. случайные величины и коррелированы.
По виду эмпирической линии регрессии можно предположить, что между случайными величинами существует линейная корреляция, т. е. . Находим коэффициенты и по формулам (7):
; .
Тогда уравнение линейной регрессии
.
Для построения полученной прямой возьмем две точки
110 |
140 | |
26,4 |
32,7 |
График прямой достаточно близко расположен по отношению к опытной линии регрессии. Коэффициент корреляции показывает, что зависимость между случайными величинами и заметная и с увеличением значений одной случайной величины значения другой случайной величины имеют тенденцию в среднем увеличиваться.
Заключение.
Возникновение и развитие математической статистики, как и других математических дисциплин, определялось потребностями практики; в настоящее время ее методы широко используются в различных технических дисциплинах. Они играют важную роль в экономических исследованиях, сельском хозяйстве, биологии, психологии, медицине, физических науках, геологии, социологических исследованиях и других, считавшихся долго далекими от математики, науках.
Список литературы.
Информация о работе Основные понятия, методы и приемы математической статистики