Основные понятия, методы и приемы математической статистики

Автор работы: Пользователь скрыл имя, 01 Апреля 2012 в 19:26, реферат

Краткое описание

Историю статистики как науки о статистических выводах обычно начинают с забавного эпизода, изложенного Ж. Бертраном в предисловии к его курсу «Исчисление вероятностей»: « Однажды в Неаполе преподобный Голиаци увидел человека из Базиликаты, который, встряхивая 3 игральные кости в чашке, держал пари, что выбросит 3 шестерки… Вы скажете, такая удача возможна. Однако человеку из Базиликаты это удалось во второй раз, и пари повторилось. Он клал кости назад в чашку 3,4,5 раз и каждый раз выбрасывал 3 шестерки. «Черт возьми,- вскричал преподобный, - кости налиты свинцом!» И так оно и было».

Содержание работы

Введение…………………………………………………………………… 2
1. Задачи математической статистики…………………………………… 3
2. Математическая статистика. Основные понятия…………………..... 4
2.1. Генеральная и выборочная совокупности…………………………. 4
2.2. Повторная и бесповторная выборки. Репрезентативная выборка.. 5
2.3. Способы отбора………………………………………………………. 6
2.4. Статистический ряд, полигон частот и гистограмма……………… 9
2.5. Статистические гипотезы……………………………………….. 12

2.6. Критерий Пирсона (хи-квадрат)……………………………….. 14
2.7. Линейная корреляция………………………………………………… 22

Заключение………………………………………………………………… 31

Список литературы………………………………………………………… 32

Содержимое работы - 1 файл

реферат по математике и статистике Смирнова.docx

— 487.26 Кб (Скачать файл)

Назовем условным средним  среднее арифметическое значений случайной величины , соответствующих значению .

Уравнение называют уравнением регрессии на ; функцию называют регрессией на , а ее график - линией регрессии.

Если функция регрессии  известна, то можно по значению одной случайной величины прогнозировать значение другой случайной величины. Корреляция называется линейной, если линия регрессии является прямой, т. е. .

Ломаная, соединяющая точки  , называется эмпирической (опытной) линией регрессии. Если точки располагаются около некоторой прямой, то в качестве уравнения теоретической линии регрессии берется , где коэффициенты находятся по формулам:

; ,    определен ниже).  (7)        

 

 

 

 

 

 

   

            

Рис. 6

 

Ковариацией двух случайных величин  и называется числовая характеристика

.

Коэффициентом корреляции между случайными величинами и называется безразмерная величина

;                 (8)

где и - средние квадратические отклонения величин и .

Коэффициент корреляции характеризует степень тесноты линейной зависимости между случайными величинами и , при этом связь тем теснее, чем ближе к единице ( ). Применяется таблица Чеддока для характеристики тесноты связи между случайными величинами и :

 

Диапазон  измерения 

выборочного

Характер  тесноты

0,1-0,3

0,3-0,5

0,5-0,7

0,7-0,9

0,9-0,99

слабая

умеренная

заметная

высокая

линейная

 

Если  , то при возрастании одной случайной величины другая имеет тенденцию в среднем возрастать. Если , то при возрастании одной случайной величины другая имеет тенденцию в среднем убывать.

Если  , то линейная корреляционная связь отсутствует, и случайные величины называются некоррелированными. Если , то связь между случайными величинами и достаточно вероятна.

Чтобы сделать обоснованные выводы о тесноте зависимости между  случайными величинами и по опытным данным, нужно установить значимость коэффициента корреляции, т. е. проверить нулевую гипотезу о том, что .

По опытным данным вычисляют  критерий проверки

.             (9)

При заданном уровне значимости и числу степеней свободы находят критическое значение для двусторонней критической области по таблице Стьюдента (смотрите таблицу прил. 3).

Если  , то выдвинутую гипотезу принимают, т. е. выборочный коэффициент незначим, а случайные величины и некоррелированы.

Если  - гипотезу отвергают, т. е. выборочный коэффициент корреляции значимо отличается от нуля, а случайные величины коррелированны.

 

Пример 4. Вычислить выборочный коэффициент корреляции , проверить его значимость и найти уравнение линии регрессии.

 

16,5-19,5

19,5-22,5

22,5-25,5

25,5-28,5

28,5-21,5

31,5-34,5

34,5-37,5

97,5-102,5

6

3

1

       

102,5-107,5

     

4

3

2

 

107,5-112,5

   

6

5

2

   

112,5-117,5

   

1

6

3

   

117,5-122,5

   

2

3

9

2

1

122,5-127,5

     

5

7

3

 

127,5-132,5

   

1

 

4

4

 

132,5-137,5

     

1

5

1

 

137,5-142,5

       

2

4

4

 

Решение. Найдем условные средние, соответствующие значению , по формуле . Тогда и т. д.

Составим корреляционную таблицу:

 

 

 

 

 

 

18

21

24

27

30

33

36

100

6

3

1

       

10

19,5

105

     

4

3

2

 

9

29,4

110

   

6

5

2

   

13

26,1

115

   

1

6

3

   

10

27,6

120

   

2

3

9

2

1

17

29,5

125

     

5

7

3

 

15

29,6

130

   

1

 

4

4

 

9

30,7

135

     

1

5

1

 

7

30,0

140

       

2

4

4

10

33,6

6

3

11

24

35

16

5

100

 

 

Контроль расчетов: - объем выборки.

Для построения эмпирической линии  регрессии точки  , ,…, соединим ломаной линией.

 

 

  

 

 

 

 

 

 

      0                      

 

Рис. 7

 

Для нахождения выборочного коэффициента линейной корреляции найдем

;

.

Вспомогательно найдем:

;

;

.

Тогда

.

.

Определим ковариацию между и по формуле

.

Находим коэффициент корреляции по формуле (8):

.

Имеем , следовательно, связь между случайными величинами и достаточно вероятна.

Для проверки значимости коэффициента корреляции проверим нулевую гипотезу ; конкурирующая гипотеза .

Найдем по опытным данным величину

.

Найдем критическое значение по таблице критерия Стьюдента (прил. 3) при уровне значимости и числе степеней свободы . Тогда , поэтому гипотезу отвергаем и принимаем гипотезу , т. е. случайные величины и коррелированы.

По виду эмпирической линии регрессии  можно предположить, что между  случайными величинами существует линейная корреляция, т. е. . Находим коэффициенты и по формулам (7):

;   .

Тогда уравнение линейной регрессии

.

 

Для построения полученной прямой возьмем две точки

 

110

140

26,4

32,7

 

График прямой достаточно близко расположен по отношению к опытной линии регрессии. Коэффициент корреляции показывает, что зависимость между случайными величинами и заметная и с увеличением значений одной случайной величины значения другой случайной величины имеют тенденцию в среднем увеличиваться.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Заключение.

Возникновение и развитие математической статистики, как и других математических дисциплин, определялось потребностями  практики; в настоящее время ее методы широко используются в различных  технических дисциплинах. Они играют важную роль в экономических исследованиях, сельском хозяйстве, биологии, психологии, медицине, физических науках, геологии, социологических исследованиях  и других, считавшихся долго далекими от математики, науках.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Список литературы.

  1. Гмурман В. Е. Теория вероятностей и математическая статистика. – М.: Высшая школа, 1977. – с. 286.
  2. Демиденко Е. З. Линейная и нелинейная регрессия. – М.: Финансы и статистика, 1981.
  3. Колмогоров А. Н. и др. Введение в теорию вероятностей. – М.: Наука, 1982. – с. 64.
  4. Ивченко Г.И. Медведев Ю.И. Математическая статистика: Учебное пособие для втузов. - М.: Высшая школа,1984.-с.6-7
  5. Чистяков В. П. Курс теории вероятностей. – М.: Наука, 1982. – с. 207

                                                        1

Информация о работе Основные понятия, методы и приемы математической статистики