Основные понятия, методы и приемы математической статистики

Автор работы: Пользователь скрыл имя, 01 Апреля 2012 в 19:26, реферат

Краткое описание

Историю статистики как науки о статистических выводах обычно начинают с забавного эпизода, изложенного Ж. Бертраном в предисловии к его курсу «Исчисление вероятностей»: « Однажды в Неаполе преподобный Голиаци увидел человека из Базиликаты, который, встряхивая 3 игральные кости в чашке, держал пари, что выбросит 3 шестерки… Вы скажете, такая удача возможна. Однако человеку из Базиликаты это удалось во второй раз, и пари повторилось. Он клал кости назад в чашку 3,4,5 раз и каждый раз выбрасывал 3 шестерки. «Черт возьми,- вскричал преподобный, - кости налиты свинцом!» И так оно и было».

Содержание работы

Введение…………………………………………………………………… 2
1. Задачи математической статистики…………………………………… 3
2. Математическая статистика. Основные понятия…………………..... 4
2.1. Генеральная и выборочная совокупности…………………………. 4
2.2. Повторная и бесповторная выборки. Репрезентативная выборка.. 5
2.3. Способы отбора………………………………………………………. 6
2.4. Статистический ряд, полигон частот и гистограмма……………… 9
2.5. Статистические гипотезы……………………………………….. 12

2.6. Критерий Пирсона (хи-квадрат)……………………………….. 14
2.7. Линейная корреляция………………………………………………… 22

Заключение………………………………………………………………… 31

Список литературы………………………………………………………… 32

Содержимое работы - 1 файл

реферат по математике и статистике Смирнова.docx

— 487.26 Кб (Скачать файл)

Простым случайным называют такой отбор, при котором объекты извлекают по одному из всей генеральной совокупности. Осуществить простой отбор можно различными способами. Например, для извлечения n объектов из генеральной совокупности объема N поступают так: выписывают номера от 1 до N на карточках, которые тщательно перемешивают, и наугад вынимают одну карточку; объект, имеющий одинаковый номер с извлеченной карточкой, подвергают обследованию; затем карточку возвращают в пачку и процесс повторяют, т.е. карточки перемешивают, наугад вынимают одну из них и т.д. Так поступают n раз; в итоге получают простую случайную повторную выборку объема n.

Если извлеченные карточки не возвращать в пачку, то выборка является простой случайной бесповторной.

При большом объеме генеральной  совокупности описанный процесс  оказывается очень трудоемким. В  этом случае пользуются готовыми таблицами  «случайных чисел», в которых числа  расположены в случайном порядке. Для того, чтобы отобрать, например, 50 объектов из пронумерованной генеральной совокупности, открывают любую страницу таблицы случайных чисел и выписывают подряд 50 чисел; в выборку попадают те объекты, номера которых совпадают с выписанными случайными числами. Если бы оказалось, что случайное число таблицы превышает число N, то такое случайное число пропускают. При осуществлении бесповторной выборки случайные числа таблицы, уже встречавшиеся ранее, следует также пропустить.

Типическим называют отбор, при котором объекты отбираются не из всей генеральной совокупности, а из каждой ее «типической» части. Например, если детали изготавливают на нескольких станках, то отбор производят не из всей совокупности деталей, произведенных всеми станками, а из продукции каждого станка в отдельности. Типическим отбором пользуются тогда, когда обследуемый признак заметно колеблется в различных типических частях генеральной совокупности. Например, если продукция изготавливается на нескольких машинах, среди которых есть более и менее изношенные, то здесь типический отбор целесообразен.

Механическим называют отбор, при котором генеральную совокупность «механически» делят на столько групп, сколько объектов должно войти в выборку, а из группы отбирают один объект. Например, если нужно отобрать 20% изготовленных станком деталей, то отбирают каждую пятую деталь; если требуется отобрать 5% деталей, то отбирают каждую двадцатую деталь, и т.д. Следует указать, что иногда механический отбор может не обеспечить репрезентативности выборки. Например, если отбирают каждый двадцатый обтачиваемый валик, причем сразу же после отбора производят замену резца, то отобранными окажутся все валики, обточенные затупленными резцами. В таком случае следует устранить совпадение ритма отбора с ритмом замены резца, для чего надо отбирать, скажем, каждый десятый валик из двадцати обточенных.

Серийным называют отбор, при котором объекты отбирают из генеральной совокупности не по одному, а «сериями», которые подвергаются сплошному обследованию. Например, если изделия изготовляются большой группой станков-автоматов, то подвергают сплошному обследованию продукцию только нескольких станков. Серийным отбором пользуются тогда, когда обследуемый признак колеблется в различных сериях незначительно.

Подчеркнем, что на практике часто  применяется комбинированный отбор, при котором сочетаются указанные  выше способы. Например, иногда разбивают  генеральную совокупность на серии  одинакового объема, затем простым  случайным отбором выбирают несколько  серий и, наконец, из каждой серии простым случайным отбором извлекают отдельные объекты.

 

 

 

 

Статистический ряд, полигон  частот и гистограмма.

 

Первым шагом в обработке  полученных данных является составление  статистического или вариационного  ряда.

Статистический  ряд – это таблица, в которой перечислены варианты в порядке возрастания и указаны соответствующие им частоты.

Для графического изображения статистического  ряда частот служит ломаная в прямоугольной декартовой системе координат с вершинами в точках - называемая полигоном частот, или ломаная с вершинами в точках - называемая полигоном относительных частот. Здесь - возможные значения вариант, - частота, т. е. количество появления варианты, - объем выборки. При большом объеме выборки ее элементы объединяются в группы (разряды), представляя результаты опытов в виде сгруппированного статистического ряда. Для этого интервал, содержащий все элементы выборки, разбивается на непересекающихся интервалов, обычно одинаковой длины .

Для графического изображения сгруппированной  выборки служит ступенчатая фигура из прямоугольников, называемая гистограммой. Для построения гистограммы на оси откладываются интервалы длины , которые служат основаниями прямоугольников, а их высоты определяются отношением , если мы строим гистограмму частот, или , если мы строим гистограмму относительных частот.

 

Пример 1. а) Дан статистический ряд. Требуется построить полигон относительных частот. б) Дан сгруппированный статистический ряд. Требуется построить гистограмму относительных частот.

 

а)

значения  вариант

15

16

17

18

19

частоты

1

5

6

5

3

 

 

б)

границы

интервалов

10-20

20-30

30-40

40-50

50-60

частоты

1

2

7

18

12

 

Решение. а) Для построения полигона частот найдем относительные частоты по формуле , где .

Результат запишем  в таблицу 

 

15

16

17

18

19

 

1

5

6

5

3

1/20=0,05

5/20=0,25

6/20=0,3

5/20=0,25

3/20=0,15

 

 

Строим ломаную с координатами (рис. 1)

 

  

 

         

           

 

Рис. 1

Замечание. Обычно при построении полигона масштаб по осям берется неодинаковым.

б) Для построения гистограммы относительных  частот найдем относительные частоты  по формуле  , высоты прямоугольников ¾ по формуле , где , . Величина характеризует плотность попадания вариант в i-ый интервал. Результаты удобно записать в таблицу.

 

10 - 20

20 - 30

30 - 40

40 - 50

50 - 60

 

1

2

7

18

12

 

1/40 = 0,025

 

2/40 = 0,05

 

7/40 = 0,175

 

18/40 = 0,45

 

12/40 = 0,3

0,025/10 =

0,0025

0,05/10 = 0,005

0,175/10 = 0,0175

0,45/10 = 0,045

0,3/10 = 0,03

 

 

 

 

Строим гистограмму (рис. 2).

 

 

 

 

                                                                             

 

 

Рис. 2

Статистические гипотезы.

 

 

Во многих случаях результаты наблюдений используются для проверки предположений (гипотез) относительно тех или иных свойств распределения генеральной  совокупности. В частности, такого рода задачи возникают при сравнении  различных технологических процессов  или методов обработки по определенным измеряемым признакам, например, по точности, производительности и т. д.

Пусть ¾ наблюдаемая дискретная или непрерывная случайная величина.

Статистической  гипотезой называется предположение относительно параметров или вида распределения случайной величины .

Основной  или нулевой гипотезой называют выдвинутую гипотезу, а гипотезу , ей противоречащую ¾ конкурирующей или альтернативной.

Правило, по которому принимается  решение принять или отклонить  гипотезу называют статистическим критерием . Обычно статистические критерии выражаются числами, которые вычисляются по вариантам выборки, или находятся теоретически. Значение критерия, найденное на основе выборки наблюдений случайной величины , называют выборочным и обозначают . Значение критерия, которое находится по таблице, называется теоретическим и обозначается .

Проверка статистической гипотезы основывается на принципе, в соответствии с которым маловероятные события  считаются невозможными, а события, имеющие большую вероятность, считаются  достоверными. Этот принцип можно  реализовать следующим образом. Перед анализом выборки фиксируется  некоторая малая вероятность  , называемая уровнем значимости, и равная вероятности отвергнуть правильную гипотезу. Таким образом, вероятность принять правильную гипотезу будет равна . Уровень значимости определяет размер «критической области».

Критическая область  ¾ те значения критерия , при которых гипотезу отвергают. Критерий, основанный на использовании заранее заданного уровня значимости, называется критерием значимости.

Таким образом, проверка значимости статистической гипотезы при помощи критерия значимости может быть разбита на следующие  этапы:

  1. сформулировать проверяемую ( ) и альтернативную ( ) гипотезы;
  2. назначить уровень значимости ;
  3. выбрать статистический критерий;
  4. определить теоретическое ( ) и выборочное ( ) значения критерия;
  5. определить критическую область ;
  6. принять статистическое решение: если , то гипотезу принять, т. е. считать, что гипотеза не противоречит результатам наблюдений; если , то отклонить гипотезу как не согласующуюся с результатами наблюдений.

Информация о работе Основные понятия, методы и приемы математической статистики