Автор работы: Пользователь скрыл имя, 16 Октября 2011 в 14:11, курсовая работа
Цель работы состоит в том, чтобы получить все необходимые и наиболее важные знания о теории игр, а именно: изучить основные понятия и определения, рассмотреть некоторые виды игр, наиболее подробно ознакомиться с матричными играми, а также с методами и алгоритмами их решения.
Введение………………………………………………………………….…. …...5
I. Теоретическая часть…………………………………………………………. 6
1.1. Понятие теории игр…………………………………………………….......-
1.1.1.Основные понятия и определения.............................................................-
1.1.2. Классификация игр…………………………………..………….. ……...7
1.1.3. Игры с природой……………………..………………………….. …….10
1.2. Матричные игры…………………………..……………………….. ……11
1.2.1. Основные понятия матричных игр…………………………………...... -
1.2.2. Смешанное расширение матричной игры……………………….. ......14
1.2.3. Свойства решений матричных игр…………………………………....17
1.2.4. Сведение матричной игры к задаче линейного
программирования……………………………………………………...20
II. Практическая часть………………………………………………………...23
2.1. Постановка задачи……………………………………………………….... -
2.2. Критерии для принятия решений……………………………………….24
2.3. Решение задачи…………………………………………………………..25
Заключение……………………………………………………………………...29
Список литературы
1.2.4. Сведение матричной игры к задаче линейного программирования.
Предположим, что цена игры положительна (u > 0). Если это не так, то согласно свойству 6 всегда можно подобрать такое число с, прибавление которого ко всем элементам матрицы выигрышей даёт матрицу с положительными элементами, и следовательно, с положительным значением цены игры. При этом оптимальные смешанные стратегии обоих игроков не изменяются.
Итак, пусть дана матричная игра с матрицей А порядка m х n. Согласно свойству 7 оптимальные смешанные стратегии х = (х1, ..., хm), y = (y1, ..., yn) соответственно игроков 1 и 2 и цена игры u должны удовлетворять соотношениям.
(1)
(2)
Разделим все уравнения и неравенства в (1) и (2) на u (это можно сделать, т.к. по предположению u > 0) и введём обозначения :
, ,
Тогда (1) и (2) перепишется в виде :
, , , ,
, , , .
Поскольку первый игрок стремится найти такие значения хi и, следовательно, pi , чтобы цена игры u была максимальной, то решение первой задачи сводится к нахождению таких неотрицательных значений pi , при которых
, . (3)
Поскольку второй игрок стремится найти такие значения yj и, следовательно, qj, чтобы цена игры u была наименьшей, то решение второй задачи сводится к нахождению таких неотрицательных значений qj, , при которых
, . (4)
Формулы (3) и (4) выражают двойственные друг другу задачи линейного программирования (ЛП).
Решив эти задачи, получим значения pi , qj и u.Тогда смешанные стратегии, т.е. xi и yj получаются по формулам :
(
II. Практическая часть.
2.1. Постановка задачи.
Задача о замене оборудования (модели принятия решения).
Задача заключается в следующем. После нескольких лет эксплуатации автопарк АТП оказывается в одном из следующих состояний:
В зависимости
от сложившейся ситуации руководство
предприятия в состоянии
Требуется:
а) накопленный опыт показывает, что вероятности указанных выше состояний транспортного средства равны, соответственно q1, q2, q3;
б) имеющийся
опыт свидетельствует, что все три
возможных состояния
в) о вероятностях состояния транспортного средства ничего определенного сказать нельзя.
В задаче использовать критерии Байеса, Лапласа, Вальда, Сэвиджа, Гурвица.
Замечание: указанные выше затраты включают кроме ремонта и убытки, вызванные ухудшением качества обслуживания.
а1 | а2 | а3 | b1 | b2 | b3 | c1 | c2 | c3 | q1 | q2 | q3 | g |
5 | 11 | 9 | 7 | 12 | 6 | 15 | 10 | 16 | 0,3 | 0,5 | 0,2 | 0,7 |
2.2. Критерии для принятия решений.
Для решения данной задачи необходимо рассмотреть матрицу рисков R и ряд критериев, которые применяются для решения игр с природой. Элементы матрицы rij представляют собой разность между выигрышем, который получил бы игрок А, если бы знал состояние природы Пij, и выигрышем, который он получит в тех же условиях, применяя стратегию Аi, то есть
rij = βj - αij, где βj = max αij.
При решении игр с природой применяется ряд критериев.
1. Если известно распределение вероятностей qj (j = ), ∑qj=1 различных состояний природы Пj, то применяется критерий Байеса: критерием принятия решения является максимум математического ожидания выигрыша (минимум математического ожидания риска).
Запишем
платежную матрицу (αij) и матрицу
рисков гij в виде таблицы 1.1. и таблицы
1.2.
Таблица 1.1.
Стратегии Аi | П1 | П2 | … | Пn | Средний
выигрыш ai |
А1 | a11 | a12 | … | a1n | a1 |
А2 | a12 | a13 | … | a2n | a2 |
… | … | … | … | … | … |
Аm | am1 | am2 | … | amn | am |
qj | q1 | q2 | … | qn |
Таблица 1.2.
Стратегии Аi | П1 | П2 | … | Пn | Средний
риск rij |
А1 | r11 | r12 | … | r1n | r1 |
А2 | r12 | r13 | … | r2n | r2 |
… | … | … | … | … | … |
Аm | rm1 | rm2 | … | rmn | rm |
qj | q1 | q2 | … | qn |
По критерию Байеса за оптимальную принимается та стратегия Аi, при которой максимизируется средний выигрыш, то есть обеспечивается
а = max аi, где ∑ aijqj( ) и минимизируется средний риск, то есть обеспечивается г = min ri, где ri=∑ aijqj.
2. Если все состояния природы равновероятны, то есть q1=q2=…qn =l/n, то используется принцип недостаточного основания Лапласа. Оптимальной считается стратегия, обеспечивающая максимум среднего выигрыша.
3. Максимальный критерий Вальда совпадает с критерием выбора максимальной стратегии, позволяющей получить нижнюю цену α игры для двух лиц с нулевой суммой, то есть
а = max min aij
4. Критерий минимального риска Сэвиджа рекомендует выбирать стратегию, при которой величина риска принимает наименьшее значение в наихудших условиях, то есть обеспечивается max min rij
Критерии Вальда и Сэвиджа выражают пессимистическую оценку ситуации.
5. Критерий Гурвица рекомендует принимать решение о выборе стратегии, при которой имеет место max(λ min aij + (1-λ) max aij), где 0 ≤ λ ≤ 1
Значения λ выбираются исходя из опыта или по субъективным соображениям. При λ = 0 имеет место критерий крайнего оптимизма, при λ = 1 — критерий пессимизма Вальда.
2.3. Решение задачи.
В качестве «статистика» выступает руководство предприятия, обладающее тремя стратегиями: A1, A2 и А3. Второй игрок «природы» П — комплекс всех факторов и условий, в которых будет функционировать АТП. «Выигрышами» статистика будут затраты, связанные с реализацией стратегий A1, А2 и А3 и составляющие платежную матрицу (табл. 1.3).
Проведем исследование по различным критериям.
Таблица 1.3.
П1 | П2 | П3 | аi | αi | |
A1 | -5 | -11 | -9 | -8,8 | -11 |
A2 | -7 | -12 | -6 | -9,3 | -12 |
A3 | -15 | -10 | -16 | -12,7 | -16 |
qj | 0,3 | 0,5 | 0,2 | ||
βj | -5 | -10 | -6 |