Оценка точности и достоверности результатов моделирования

Автор работы: Пользователь скрыл имя, 13 Мая 2012 в 13:27, контрольная работа

Краткое описание

Конечная цель моделирования — принятие решения, которое должно быть выработано на основе всестороннего анализа полученных результатов. Этот этап решающий — либо вы продолжаете исследование, либо заканчиваете. Возможно, вам известен ожидаемый результат, тогда необходимо сравнить полученный и ожидаемый результаты. В случае совпадения вы сможете принять решение.

Содержание работы

Введение……………………………………………………………….3
Особенности статистической обработки результатов ЭВМ………4
Корреляционный анализ результатов моделирования………….…9
Регрессионный анализ результатов моделирования………………11
Дисперсионный анализ результатов моделирования…………...…15
Вывод…………………………………………………………………..18
Список используемой литературы…………………………………..19

Содержимое работы - 1 файл

Семестровая Моделирование систем Додонов.doc

— 226.50 Кб (Скачать файл)

   При анализе результатов моделирования  системы S важно отметить то обстоятельство, что даже если удалось установить тесную зависимость между двумя переменными, то отсюда еще непосредственно не следует их причинно-следственная взаимообусловленность. Возможна ситуация, когда случайные x и h стохастически зависимы, хотя причинно они являются для системы S независимыми. При статистическом моделировании наличие такой зависимости может иметь место, например, из-за коррелированности последовательностей псевдослучайных чисел, используемых для имитации событий, положенных в основу вычисления значений х и у.

   Таким образом, корреляционный анализ устанавливает  связь между исследуемыми случайными переменными машинной модели и оценивает тесноту этой связи. Однако в дополнение к этому желательно располагать моделью зависимости, полученной после обработки результатов моделирования. 
 
 
 
 
 
 
 
 
 
 

    Регрессионный анализ результатов  моделирования.

     Регрессионный анализ — метод моделирования измеряемых данных и исследования их свойств. Данные состоят из пар значений зависимой переменной (переменной отклика) и независимой переменной (объясняющей переменной). Регрессионная модель есть функция независимой переменной и параметров с добавленной случайной переменной. Параметры модели настраиваются таким образом, что модель наилучшим образом приближает данные. Критерием качества приближения (целевой функцией) обычно является среднеквадратичная ошибка: сумма квадратов разности значений модели и зависимой переменной для всех значений независимой переменной в качестве аргумента. Регрессионный анализ — раздел математической статистики и машинного обучения. Предполагается, что зависимая переменная есть сумма значений некоторой модели и случайной величины. Относительно характера распределения этой величины делаются предположения, называемые гипотезой порождения данных. Для подтверждения или опровержения этой гипотезы выполняются статистические тесты, называемые анализом остатков. При этом предполагается, что независимая переменная не содержит ошибок. Регрессионный анализ используется для прогнозаанализа временных рядовтестирования гипотез и выявления скрытых взаимосвязей в данных.

     Определение регрессионного анализа

     Регрессия — зависимость математического ожидания(например, среднего значения) случайной величины от одной или нескольких других случайных величин (свободных переменных), то есть  . Регрессионным анализом называется поиск такой функции  , которая описывает эту зависимость. Регрессия может быть представлена в виде суммы неслучайной и случайной составляющих.

     

     где   — функция регрессионной зависимости, а   — аддитивная случайная величина с нулевым мат ожиданием. Предположение о характере распределения этой величины называется гипотезой порождения данных. Обычно предполагается, что величина   имеет гауссово распределение с нулевым средним и дисперсией  .

     Задача  нахождения регрессионной модели нескольких свободных переменных ставится следующим образом. Задана выборка — множество   значений свободных переменных и множество  соответствующих им значений зависимой переменной. Эти множества обозначаются как  , множество исходных данных  . Задана регрессионная модель — параметрическое семейство функций   зависящая от параметров   и свободных переменных  . Требуется найти наиболее вероятные параметры  :

     

     Функция вероятности   зависит от гипотезы порождения данных и задается Байесовским выводом или методом наибольшего правдоподобия.

     Линейная регрессия

     Линейная  регрессия предполагает, что функция   зависит от параметров   линейно. При этом линейная зависимость от свободной переменной   необязательна,

     

     В случае, когда функция   линейная регрессия имеет вид

     

     здесь   — компоненты вектора  .

     Значения  параметров в случае линейной регрессии  находят с помощью метода наименьших квадратов. Использование этого метода обосновано предположением о гауссовском распределении случайной переменной.

     Разности   между фактическими значениями зависимой переменной и восстановленными называются регрессионными остатками. В литературе используются также синонимы: невязки и ошибки. Одной из важных оценок критерия качества полученной зависимости является сумма квадратов остатков:

     

     Здесь   — Sum of Squared Errors.

     Дисперсия остатков вычисляется по формуле

     

     Здесь   — Mean Square Error, среднеквадратичная ошибка.

            

     На  графиках представлены выборки, обозначенные синими точками, и регрессионные зависимости, обозначенные сплошными линиями. По оси абсцисс отложена свободная переменная, а по оси ординат — зависимая. Все три зависимости линейны относительно параметров.

     Нелинейная регрессия

     Нелинейные регрессионные модели — модели вида

         

         которые не могут быть представлены в виде скалярного произведения

         

         где   — параметры регрессионной модели,   — свободная переменная из пространства  ,   — зависимая переменная,   — случайная величина и   — функция из некоторого заданного множества.

         Значения  параметров в случае нелинейной регрессии  находят с помощью одного из методов  градиентного спуска, например алгоритма Левенберга-Марквардта.

    Дисперсионный анализ результатов  моделирования.

     В процессе наблюдения за исследуемым  объектом качественные факторы произвольно  или заданным образом изменяются. Конкретная реализация фактора (например, определенный температурный режим, выбранное оборудование или материал) называется уровнем фактора или способом обработки. Модель дисперсионного анализа с фиксированными уровнями факторов называют моделью I, модель со случайными факторами - моделью II. Благодаря варьированию фактора можно исследовать его влияние на величину отклика. В настоящее время общая теория дисперсионного анализа разработана для моделей I.

     В зависимости от количества факторов, определяющих вариацию результативного  признака, дисперсионный анализ подразделяют на однофакторный и многофакторный.

     Основными схемами организации исходных данных с двумя и более факторами  являются:

     - перекрестная классификация, характерная  для моделей I, в которых каждый  уровень одного фактора сочетается при планировании эксперимента с каждой градацией другого фактора;

     - иерархическая (гнездовая) классификация,  характерная для модели II, в которой  каждому случайному, наудачу выбранному  значению одного фактора соответствует  свое подмножество значений второго фактора.

     Если  одновременно исследуется зависимость  отклика от качественных и количественных факторов, т.е. факторов смешанной природы, то используется ковариационный анализ /3/.

     При обработке данных эксперимента наиболее разработанными и поэтому распространенными считаются две модели. Их различие обусловлено спецификой планирования самого эксперимента. В модели дисперсионного анализа с фиксированными эффектами исследователь намеренно устанавливает строго определенные уровни изучаемого фактора. Термин «фиксированный эффект» в данном контексте имеет тот смысл, что самим исследователем фиксируется количество уровней фактора и различия между ними. При повторении эксперимента он или другой исследователь выберет те же самые уровни фактора. В модели со случайными эффектами уровни значения фактора выбираются исследователем случайно из широкого диапазона значений фактора, и при повторных экспериментах, естественно, этот диапазон будет другим.

     Таким образом, данные модели отличаются между  собой способом выбора уровней фактора, что, очевидно, в первую очередь влияет на возможность обобщения полученных экспериментальных результатов. Для дисперсионного анализа однофакторных экспериментов различие этих двух моделей не столь существенно, однако в многофакторном дисперсионном анализе оно может оказаться весьма важным.

     При проведении дисперсионного анализа  должны выполняться следующие статистические допущения: независимо от уровня фактора  величины отклика имеют нормальный (Гауссовский) закон распределения  и одинаковую дисперсию. Такое равенство дисперсий называется гомогенностью. Таким образом, изменение способа обработки сказывается лишь на положении случайной величины отклика, которое характеризуется средним значением или медианой. Поэтому все наблюдения отклика принадлежат сдвиговому семейству нормальных распределений.

     Говорят, что техника дисперсионного анализа  является "робастной". Этот термин, используемый статистиками, означает, что данные допущения могут быть в некоторой степени нарушены, но несмотря на это, технику можно использовать.

     При неизвестном законе распределения  величин отклика используют непараметрические (чаще всего ранговые) методы анализа.

     В основе дисперсионного анализа лежит  разделение дисперсии на части или  компоненты. Вариацию, обусловленную  влиянием фактора, положенного в основу группировки, характеризует межгрупповая дисперсия у2. Она является мерой вариации частных средних по группам вокруг общей средней и определяется по формуле:

     где k - число групп;

     n- число единиц в j-ой группе;

     - частная средняя по j-ой группе;

     - общая средняя по совокупности  единиц.

     Вариацию, обусловленную влиянием прочих факторов, характеризует в каждой группе внутригрупповая  дисперсия уj2.

     Между общей дисперсией у02, внутригрупповой дисперсией уи межгрупповой дисперсией существует соотношение:

     у0= + у2.

     Внутригрупповая дисперсия объясняет влияние  неучтенных при группировке факторов, а межгрупповая дисперсия объясняет  влияние факторов группировки на среднее значение по группе. 
 
 
 
 
 
 
 
 
 
 

    Выводы

          Успех имитационного эксперимента с моделью системы существенным образом зависит от правильного решения вопросов обработки и последующего анализа и интерпретации результатов моделирования. Особенно важно решить проблему текущей обработки экспериментальной информации при использовании модели для целей автоматизации проектирования систем. 
     
     
     
     
     
     
     
     
     
     
     
     
     
     
     
     
     
     
     
     
     
     

   Список  используемой литературы:

     1     Кремер Н.Ш. Теория вероятности и математическая статистика. М.: Юнити - Дана, 2002.-343с.

     2      Гмурман В.Е. Теория вероятностей и математическая статистика. - М.: Высшая школа, 2003.-523с.

     3 http://www.machinelearning.ru/wiki/index.php?title=%D0%A0%D0%B5%D0%B3%D1%80%D0%B5%D1%81%D1%81%D0%B8%D1%8F

     4   Стрижов В. В. Методы индуктивного порождения регрессионных моделей. М.: ВЦ РАН. 2008. 55 с

  1.    Брандт З. Анализ данных. М.: Мир. 2003.

Информация о работе Оценка точности и достоверности результатов моделирования