Понятие теории игр

Автор работы: Пользователь скрыл имя, 16 Октября 2011 в 14:11, курсовая работа

Краткое описание

Цель работы состоит в том, чтобы получить все необходимые и наиболее важные знания о теории игр, а именно: изучить основные понятия и определения, рассмотреть некоторые виды игр, наиболее подробно ознакомиться с матричными играми, а также с методами и алгоритмами их решения.

Содержание работы

Введение………………………………………………………………….…. …...5
I. Теоретическая часть…………………………………………………………. 6
1.1. Понятие теории игр…………………………………………………….......-
1.1.1.Основные понятия и определения.............................................................-
1.1.2. Классификация игр…………………………………..………….. ……...7
1.1.3. Игры с природой……………………..………………………….. …….10
1.2. Матричные игры…………………………..……………………….. ……11
1.2.1. Основные понятия матричных игр…………………………………...... -
1.2.2. Смешанное расширение матричной игры……………………….. ......14
1.2.3. Свойства решений матричных игр…………………………………....17
1.2.4. Сведение матричной игры к задаче линейного
программирования……………………………………………………...20
II. Практическая часть………………………………………………………...23
2.1. Постановка задачи……………………………………………………….... -
2.2. Критерии для принятия решений……………………………………….24
2.3. Решение задачи…………………………………………………………..25
Заключение……………………………………………………………………...29
Список литературы

Содержимое работы - 1 файл

Курсовая ЭММ.docx

— 82.57 Кб (Скачать файл)

    1.2.4. Сведение матричной игры к задаче линейного программирования.

    Предположим, что цена игры положительна (u > 0). Если это не так, то согласно свойству 6 всегда можно подобрать такое число  с, прибавление которого ко всем элементам  матрицы выигрышей даёт матрицу  с положительными элементами, и следовательно, с положительным значением цены игры. При этом оптимальные смешанные  стратегии обоих игроков не изменяются.

    Итак, пусть дана матричная игра с матрицей А порядка m х n. Согласно свойству 7 оптимальные  смешанные стратегии х = (х1, ..., хm), y = (y1, ..., yn) соответственно игроков 1 и 2 и цена игры u должны удовлетворять  соотношениям.

                            (1)

                            (2)

    Разделим  все уравнения и неравенства  в (1) и (2) на u (это можно сделать, т.к. по предположению u > 0) и введём обозначения :

         ,       ,

    Тогда (1) и (2) перепишется в виде :

     ,   ,   ,   ,

     ,   ,   ,   .

    Поскольку первый игрок стремится найти  такие значения хi и, следовательно, pi , чтобы цена игры u была максимальной, то решение первой задачи сводится к нахождению таких неотрицательных  значений pi , при которых

     ,  .                      (3)

    Поскольку второй игрок стремится найти  такие значения yj и, следовательно, qj, чтобы цена игры u была наименьшей, то решение второй задачи сводится к нахождению таких неотрицательных  значений qj, , при которых

     ,  .                      (4)

    Формулы (3) и (4) выражают двойственные друг другу  задачи линейного программирования (ЛП).

    Решив эти задачи, получим значения pi , qj  и u.Тогда смешанные стратегии, т.е. xi и yj получаются по формулам :

                                 (5) 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

    II. Практическая часть.

    2.1. Постановка задачи.

    Задача  о замене оборудования (модели принятия решения).

Задача  заключается в следующем. После  нескольких лет эксплуатации автопарк АТП оказывается в одном из следующих состояний:

  1. машина может использоваться в следующем году после профилактического ремонта;
  2. для бесперебойной работы автомобиль нуждается в текущем ремонте, в результате которого происходит замена отдельных деталей и узлов транспортного средства;
  3. автомобиль требует капитального ремонта или замены.

В зависимости  от сложившейся ситуации руководство  предприятия в состоянии принять  такие решения:

  1. отремонтировать транспортное средство силами своих специалистов, что потребует затрат в зависимости от состояния машины, равных а1, а2, а3 ден. ед.;
  2. пригласить специальную бригаду механиков для ремонта, расходы в этом случае составят b1, b2, b3 ден. ед.;
  3. заменить машину новой. Совокупные затраты в результате этого мероприятия будут равны, соответственно, с1, с2, с3 ден. ед.
 

Требуется:

  1. Придать описанной ситуации игровую схему, установить характер игры и выявить ее участников, указать возможные чистые стратегии сторон;
  2. составить платежную матрицу;
  3. выяснить, какое решение о работе оборудования в предстоящем году целесообразно рекомендовать руководству предприятия, чтобы минимизировать потери при следующих предположениях:

    а) накопленный  опыт показывает, что вероятности  указанных выше состояний транспортного  средства равны, соответственно q1, q2, q3;

    б) имеющийся  опыт свидетельствует, что все три  возможных состояния транспортного  средства равновероятны;

    в) о  вероятностях состояния транспортного  средства ничего определенного сказать  нельзя.

В задаче использовать критерии Байеса, Лапласа, Вальда, Сэвиджа, Гурвица.

Замечание: указанные выше затраты включают кроме ремонта и убытки, вызванные  ухудшением качества обслуживания.

а1 а2 а3 b1 b2 b3 c1 c2 c3 q1 q2 q3 g
5 11 9 7 12 6 15 10 16 0,3 0,5 0,2 0,7
 

    2.2. Критерии для принятия  решений.

    Для решения данной задачи необходимо рассмотреть  матрицу рисков R и ряд критериев, которые применяются для решения игр с природой. Элементы матрицы rij представляют собой разность между выигрышем, который получил бы игрок А, если бы знал состояние природы Пij, и выигрышем, который он получит в тех же условиях, применяя стратегию Аi, то есть

    rij = βj - αij, где βj = max αij

    При решении игр с природой применяется  ряд критериев.

    1. Если известно распределение вероятностей qj (j = ), ∑qj=1 различных состояний природы Пj, то применяется критерий Байеса: критерием принятия решения является максимум математического ожидания выигрыша (минимум математического ожидания риска).

    Запишем платежную матрицу (αij) и матрицу рисков гij в виде таблицы 1.1. и таблицы 1.2. 

Таблица 1.1.

Стратегии Аi        П1        П2        …        Пn Средний

выигрыш ai

       А1        a11        a12        …        a1n        a1
       А2        a12        a13        …        a2n        a2
       …        …        …        …        …        …
       Аm       am1       am2        …        amn        am
        qj        q1        q2        …        qn  
 

    Таблица 1.2.

Стратегии Аi        П1        П2        …        Пn    Средний

      риск rij

       А1        r11        r12        …        r1n        r1
       А2        r12        r13        …        r2n        r2
       …        …        …        …        …        …
       Аm       rm1       rm2        …        rmn        rm
        qj        q1        q2        …        qn  
 

    По  критерию Байеса за оптимальную принимается  та стратегия Аi, при которой максимизируется средний выигрыш, то есть обеспечивается

    а = max аi, где ∑ aijqj( ) и минимизируется средний риск, то есть обеспечивается г = min ri, где ri=∑ aijqj.

    2. Если все состояния природы равновероятны, то есть q1=q2=…qn =l/n, то используется принцип недостаточного основания Лапласа. Оптимальной считается стратегия, обеспечивающая максимум среднего выигрыша.

    3. Максимальный критерий Вальда совпадает с критерием выбора максимальной стратегии, позволяющей получить нижнюю цену α игры для двух лиц с нулевой суммой, то есть

    а = max min aij 

    4. Критерий минимального риска Сэвиджа рекомендует выбирать стратегию, при которой величина риска принимает наименьшее значение в наихудших условиях, то есть обеспечивается max min rij

    Критерии  Вальда и Сэвиджа выражают пессимистическую оценку ситуации.

    5. Критерий Гурвица рекомендует принимать решение о выборе стратегии, при которой имеет место max(λ min aij + (1-λ) max aij), где 0 ≤ λ ≤ 1

    Значения  λ выбираются исходя из опыта или по субъективным соображениям. При λ = 0 имеет место критерий крайнего оптимизма, при λ = 1 — критерий пессимизма Вальда.

    2.3. Решение задачи.

    В качестве «статистика» выступает руководство предприятия, обладающее тремя стратегиями: A1, A2 и А3. Второй игрок «природы» П — комплекс всех факторов и условий, в которых будет функционировать АТП. «Выигрышами» статистика будут затраты, связанные с реализацией стратегий A1, А2 и А3 и составляющие платежную матрицу (табл. 1.3).

    Проведем  исследование по различным критериям.

    Таблица 1.3.

    
         П1        П2        П3         аi         αi
       A1        -5       -11        -9       -8,8       -11
       A2        -7       -12        -6       -9,3       -12
       A3       -15       -10       -16      -12,7       -16
       qj       0,3        0,5        0,2    
       βj        -5       -10        -6    

Информация о работе Понятие теории игр