Автор работы: Давыдов Максим, 31 Мая 2010 в 20:57, шпаргалка
лекции
Действительно, вспомним принятое в математическом анализе определение предела последовательности. Мы говорим, что ап → а при п →∞, если для любого ε> 0 найдется такое N, что при п > N будет выполняться неравенство \Ап — а\ <ε. Для теоремы Бернулли это значило бы, что для достаточно больших п действует соотношение
К сожалению, это утверждение неверно. Хотя и с малой вероятностью, но значения р и S/n могут отличаться значительно. Например, с положительной вероятностью S может быть равно 0. Поэтому нельзя рассчитывать на непременное выполнение указанного соотношения.
Поэтому для случайных последовательностей используется другое понятие предела: (для любого ε > 0) при п→∞. Когда требуется отличать это понятие предела от того, которое используется в математическом анализе, говорят: «последовательность случайных величин сходится по вероятности».
Закон больших чисел. При рассмотрении биномиального распределения мы вводили случайные величины Xi, i = 1,... , п, связанные с отдельными испытаниями: Xi = 1 в случае «успеха» в испытании i, и Xi = 0 — в противном случае. Ясно, что мы можем представить S в виде суммы Х1 + • • • + Хп, где случайные величины Х1,... , Хп независимы и одинаково распределены, причем для любого i: M(Xi) =р. Тогда мы можем переформулировать утверждение теоремы Бернулли в виде:
при n→∞.
Итак, здесь среднее арифметическое от большого числа независимых одинаково распределенных случайных слагаемых оказалось близким к их математическому ожиданию. На самом деле это утверждение верно не только для величин Xi, полученных из испытаний Бернулли, а является гораздо более общим. Ниже мы докажем его для любых величин Xi, имеющих дисперсию. А с помощью небольших математических усилий условие наличия дисперсии можно заменить и более слабым.
Как мы говорили, среднее арифметическое является выборочным аналогом математического ожидания. Иначе говоря, если в формуле, определяющей математическое ожидание, заменить истинную функцию распределения F случайных величин Xi на выборочную (эмпирическую) функцию распределения Fn, то получится формула среднего арифметического. На самом деле стремление при больших п значения выборочной характеристики распределения к значению соответствующей теоретической характеристики (часто говорят - к ее истинному значению) справедливо не только для среднего арифметического. При весьма слабых предположениях на свойства F и интересующей нас характеристики распределения при больших п значение выборочной характеристики распределения стремится к значению соответствующей теоретической характеристики. Это утверждение очень важно для теории вероятностей и статистики, оно называется законом больших чисел.
Пример. Мореплаватели только сравнительно недавно получили возможность определять координаты своего корабля вдали от берегов. Если широту корабля несложно установить с помощью астрономических наблюдений, то для определения долготы, т.е. угла поворота земного шара, при котором совмещаются местный меридиан и гринвичский, надо точно знать гринвичское время. Следовательно, до появления радио было необходимо иметь на корабле часы, точно идущие по гринвичскому времени.
Однако до XIX века существовавшие часы не обеспечивали необходимой для измерения долготы точности. Лишь в XIX веке были сконструированы особо точные часы — хронометр. И когда в 1831 г. в кругосветное плавание для составления карт отправлялся корабль «Бигль» (эта экспедиция сейчас широко известна благодаря участию в ней молодого тогда Ч.Дарвина), капитан корабля Фиц Рой, человек просвещенный и ученый, взял с собой 24(!) хронометра. Гринвичское время капитан определял усреднением показателей всех хронометров. И он был прав, поскольку по закону больших чисел среднее арифметическое от большого числа случайных слагаемых близко к среднему арифметическому от их математических ожиданий (как правило, ближе, чем для каждого слагаемого в отдельности). Подробнее мы обсудим это ниже.
Вернемся теперь к закону больших чисел и сформулируем простейший его вариант — теорему Чебышева.
Теорема Чебышева. Пусть Х1,...,Хп — независимые одинаково распределенные случайные величины, имеющие математическое ожидание и дисперсию. Общее значение математического ожидания этих величин обозначим через а. Тогда для любого ε> 0 при n →∞
В статистике среднее арифметическое величин X1,... , Хn обозначают . Так что кратко теорему Чебышева можно записать так: .
Центральная
предельная теорема.
Пусть θ— некоторая теоретическая
характеристика распределения, θn
— ее выборочный аналог, полученный по
выборке объема п. Оказывается, при
весьма слабых предположениях относительно
функции распределения F
и характеристики θ случайная величина
имеет асимптотически нормальное
распределение с некоторыми параметрами
(aσ2).
ОЦЕНИВАНИЕ ПАРАМЕТРОВ РАСПРЕДЕЛЕНИЯ ПО ВЫБОРКЕ
Вопросы оценки параметров статистических моделей будут рассмотрены в следующих главах. Здесь же мы обсудим подробнее методы оценивания параметров распределения по имеющейся выборке.
В математической статистике есть много подходов, которые придают высказанному выше требованию точную математическую форму. Ни один из них не может считаться универсальным или наилучшим. В зависимости от целей эти методы можно разделить на две группы. Первую группу составляют методы оценивания параметров по конечной выборке, вторую — методы оценивания по неограниченно растущей выборке. С практической точки зрения вторая группа подходов важнее, так как интуитивно понятно, что для получения сколько-либо надежных выводов о параметрах и характеристиках распределения, надо иметь достаточно информации, т.е. проделать большое количество экспериментов. Кроме того, с теоретической точки зрения вторая группа подходов проще, так как при больших п исчезают многие проблемы, относящиеся к конечным выборкам. Основой для выводов в этом случае служит закон больших чисел — при больших п значения выборочных характеристик распределения приближаются к неизвестным нам теоретическим значениям этих характеристик.
Оценки параметров распределения. Пусть мы имеем выборку из распределения, принадлежащего некоторому параметрическому семейству F(θ), и хотим по выборке оценить неизвестные нам параметры в этого распределения. Для этого часто используется следующий прием. Выбирают какую-либо характеристику распределения Т (среднее, медиану, квантиль и т.д.), выражаемую через функцию распределения. Но поскольку функция распределения F зависит от θ, то и значение характеристики Т есть функция от неизвестного нам значения θ. Выборочный аналог этой характеристики Тn на основании закона больших чисел будет близок к ее теоретическому значению, если объем наблюдений достаточно велик. В связи с этим рассмотрим уравнение, правой частью которого является теоретическое значение характеристики, а левой — ее выборочное значение: Т (θ) = Тп. Если параметр θ одномерный, то разрешая подобное уравнение, получим оценку θ. Если параметр θ многомерный (то есть параметров распределения несколько), то для их нахождения выбираются несколько характеристик распределения и составляется система из соответствующего количества уравнений.
В качестве характеристик распределения часто используют моменты (метод моментов), реже — квантили (метод квантилей). Проследим за действием этих методов на примере оценивания по выборке параметров нормального распределения (оба параметра неизвестны).
СВОЙСТВА ОЦЕНОК. ДОВЕРИТЕЛЬНОЕ ОЦЕНИВАНИЕ
Поскольку, как мы видели, для одних и тех же параметров распределения возможны и употребительны разные оценки, хотелось бы как-то сравнивать их между собой и выбирать из них те, которые лучше или которые обладают желательными свойствами. Ниже мы укажем те свойства, которые обычно имеют часто используемые оценки. Пусть θn - оценка характеристики распределения θ, полученная по выборке объема п. Тогда:
Следует заметить, что если состоятельность — практически обязательное свойство всех используемых на практике оценок (несостоятельные оценки употребляются крайне редко), то свойство несмещенности является лишь желательным. Многие часто применяемые оценки свойством несмещенности не обладают.
Эффективность оценок. Прежде чем ставить вопрос о выборе наилучшей оценки, надо научиться сравнивать оценки между собой. Единого способа сравнения оценок не существует; приходится использовать различные подходы. Чаще всего в качестве критерия качества оценки θп параметра θ выбирают малость величины М(θп - θ)2, а наилучшей оценкой считают такую оценку, для которой эта величина минимальна. Более общий подход состоит в том, что вместо величины (θп — θ)2 выбирают другую неотрицательную функцию «штрафа» W(θn, θ) за отклонение θп от θ (иногда говорят, функцию потерь), и наилучшей оценкой считают такую, для которой математическое ожидание величины штрафа М( W(θn, θ)) минимально.
Оценки, для которых минимальна некоторой функции потерь, часто называют оптимальными или эффективными. Не следует приписывать этим определениям какие-либо магические свойства, считая, что такие оценки заведомо лучше всех других. На самом деле оптимальные свойства оценок получены при определенных предположениях, которые на практике могут и не выполняться или выполняться лишь приближенно. При этом свойства подобных оценок могут оказаться не столь хорошими.
Например, среднее арифметическое элементов выборки является «эффективной» оценкой параметра а для выборки из нормального распределения Л^(а, а3): эта оценка несмещенная и обладает минимальной дисперсией. Но при отклонении распределения от нормального (например, при наличии «выбросов», т.е. резко выделяющихся значений), свойства этой оценки становятся неудовлетворительными, так как ее значения очень сильно зависит от «выбросов».
Доверительное оценивание. Во многих случаях представляет интерес не получение точечной оценки θ неизвестного параметра θ, а указание области (например, интервала на числовой прямой), в которой этот параметр находится с вероятностью, не меньшей заданной (скажем, 95 или 99%). Построить такую область можно следующим образом. Выберем число а, 0 < а < 1 — вероятность, с которой параметр θ должен попасть в построенную нами область. Пусть мы имеем оценку θ неизвестного параметра в, и для каждого значения в можем указать область А(θ, а), в которую оценка θ попадает с вероятностью не меньше а:
для любого θ ,
Тогда доверительной областью (в одномерном случае — доверительным интервалом) с уровнем доверия а для неизвестного нам истинного значения θ, построенной по наблюденному в опыте значению оценки θ, является множество
.
Можно сказать, что процесс доверительного оценивания является как бы обращением процесса проверки статистических гипотез: там мы по известному значению параметра θ строили множество А(θ), в которое с заданной вероятностью попадает некоторая статистика θ, а здесь мы по таким множествам строим область, которая накрывает с заданной вероятностью само значение θ.
Во многих статистических задачах мы предполагаем, что некоторые случайные величины имеют заданное распределение (нормальное, экспоненциальное и т.д.) с известными или неизвестными параметрами этого распределения, и далее исходя из этого допущения мы делаем те или иные выводы. Например, мы можем предположить, что рассеяние пуль при стрельбе описывается нормальным распределением, а время службы электрической лампочки — экспоненциальным. Чем лучше мы знаем законы изменчивости данных, их распределения вероятностей, тем точнее и надежней могут быть наши статистические выводы.
Однако при этом, естественно, возникает вопрос: насколько наши предположения о распределении случайных величин соответствуют экспериментальным данным? Более реалистично поставить этот вопрос иначе: не вступает ли принятая статистическая модель в противоречие с имеющимися данными? Для решения этой задачи придуманы разные способы, иначе говоря, статистические критерии. Чтобы выделить такие критерии из остальных, их часто называют критериями согласия.
Определение. Критериями согласия называют статистические критерии, предназначенные для обнаружения расхождений между гипотетической статистической моделью и реальными данными, которые эта модель призвана описать.
Лучше всего этот вопрос разработан, если наблюдения представляют случайную выборку. Теоретическая модель в этом случае описывает закон распределения. В дальнейшем мы будем обсуждать именно эту задачу, как потому что она важна и сама по себе, так и потому, что к ней удается свести многие другие проблемы согласия.
Теоретическое распределение. Мы будем называть теоретическим то распределение вероятностей, которое управляет случайным выбором. Представления о нем может дать не только теория. Источниками знаний здесь могут быть и традиция, и прошлый опыт, и предыдущие наблюдения. Надо лишь подчеркнуть, что это распределение должно быть выбрано независимо от тех данных, по которым мы собираемся его проверять. Иначе говоря, недопустимо сначала «подогнать» по выборке некоторый закон распределения, а потом пытаться проверить согласие с полученным законом по этой же выборке1.