Автор работы: Пользователь скрыл имя, 16 Октября 2011 в 14:11, курсовая работа
Цель работы состоит в том, чтобы получить все необходимые и наиболее важные знания о теории игр, а именно: изучить основные понятия и определения, рассмотреть некоторые виды игр, наиболее подробно ознакомиться с матричными играми, а также с методами и алгоритмами их решения.
Введение………………………………………………………………….…. …...5
I. Теоретическая часть…………………………………………………………. 6
1.1. Понятие теории игр…………………………………………………….......-
1.1.1.Основные понятия и определения.............................................................-
1.1.2. Классификация игр…………………………………..………….. ……...7
1.1.3. Игры с природой……………………..………………………….. …….10
1.2. Матричные игры…………………………..……………………….. ……11
1.2.1. Основные понятия матричных игр…………………………………...... -
1.2.2. Смешанное расширение матричной игры……………………….. ......14
1.2.3. Свойства решений матричных игр…………………………………....17
1.2.4. Сведение матричной игры к задаче линейного
программирования……………………………………………………...20
II. Практическая часть………………………………………………………...23
2.1. Постановка задачи……………………………………………………….... -
2.2. Критерии для принятия решений……………………………………….24
2.3. Решение задачи…………………………………………………………..25
Заключение……………………………………………………………………...29
Список литературы
Каждая стратегия игрока i= ; j = часто называется чистой стратегией.
Если рассмотреть матрицу
А =
то проведение каждой партии матричной игры с матрицей А сводится к выбору игроком 1 i-й строки, а игроком 2 j-го столбца и получения игроком 1 (за счёт игрока 2) выигрыша аij.
Главным в исследовании игр является понятие оптимальных стратегий игроков. В это понятие интуитивно вкладывается такой смысл: стратегия игрока является оптимальной, если применение этой стратегии обеспечивает ему наибольший гарантированный выигрыш при всевозможных стратегиях другого игрока. Исходя из этих позиций, игрок 1 исследует матрицу выигрышей А следующим образом: для каждого значения i (i = ) определяется минимальное значение выигрыша в зависимости от применяемых стратегий игрока 2
аij (i = )
т.е.
определяется минимальный выигрыш
для игрока 1 при условии, что он
примет свою i-ю чистую стратегию, затем
из этих минимальных выигрышей
аij = = (1).
Определение. Число , определённое по формуле (1) называется нижней чистой ценой игры и показывает, какой минимальный выигрыш может гарантировать себе игрок 1, применяя свои чистые стратегии при всевозможных действиях игрока 2.
Игрок
2 при оптимальном своём
аij
т.е. определяется max выигрыш игрока 1, при условии, что игрок 2 применит свою j-ю чистую стратегию, затем игрок 2 отыскивает такую свою j = j1 стратегию, при которой игрок 1 получит min выигрыш, т.е. находит
aij = = (2).
Определение. Число , определяемое по формуле (2), называется чистой верхней ценой игры и показывает, какой максимальный выигрыш за счёт своих стратегий может себе гарантировать игрок 1.
Другими словами, применяя свои чистые стратегии игрок 1 может обеспечить себе выигрыш не меньше , а игрок 2 за счёт применения своих чистых стратегий может не допустить выигрыш игрока 1 больше, чем .
Определение. Если в игре с матрицей А = , то говорят, что эта игра имеет седловую точку в чистых стратегиях и чистую цену игры
u = = .
Седловая точка – это пара чистых стратегий (iо,jо) соответственно игроков 1 и 2, при которых достигается равенство = . В это понятие вложен следующий смысл: если один из игроков придерживается стратегии, соответствующей седловой точке, то другой игрок не сможет поступить лучше, чем придерживаться стратегии, соответствующей седловой точке. Математически это можно записать и иначе:
(3).
где i, j – любые чистые стратегии соответственно игроков 1 и 2; (iо,jо) – стратегии, образующие седловую точку.
Таким образом, исходя из (3), седловой элемент является минимальным в iо-й строке и максимальным в jо-м столбце в матрице А. Отыскание седловой точки матрицы А происходит следующим образом: в матрице А последовательно в каждой строке находят минимальный элемент и проверяют, является ли этот элемент максимальным в своём столбце. Если да, то он и есть седловой элемент, а пара стратегий, ему соответствующая, образует седловую точку. Пара чистых стратегий (iо,jо) игроков 1 и 2, образующая седловую точку и седловой элемент , называется решением игры. При этом iо и jо называются оптимальными чистыми стратегиями соответственно игроков 1 и 2.
1.2.2. Смешанное расширение матричной игры.
Исследование
в матричных играх начинается
с нахождения её седловой точки в
чистых стратегиях. Если матричная
игра имеет седловую точку в чистых
стратегиях, то нахождением этой седловой
точки заканчивается
Определение. Смешанной стратегией игрока называется полный набор вероятностей применения его чистых стратегий.
Таким образом, если игрок 1 имеет m чистых стратегий 1,2,...,m, то его смешанная стратегия x – это набор чисел x = (x1, ..., xm) удовлетворяющих соотношениям
xi ³ 0 (i = 1,m), = 1.
Аналогично для игрока 2, который имеет n чистых стратегий, смешанная стратегия y – это набор чисел
y = (y1, ..., yn), yj ³ 0, (j = 1,n), = 1.
Так как каждый раз применение игроком одной чистой стратегии исключает применение другой, то чистые стратегии являются несовместными событиями. Кроме того, они являются единственными возможными событиями.
Чистая стратегия есть частный случай смешанной стратегии. Действительно, если в смешанной стратегии какая-либо i-я чистая стратегия применяется с вероятностью 1, то все остальные чистые стратегии не применяются. И эта i-я чистая стратегия является частным случаем смешанной стратегии. Для соблюдения секретности каждый игрок применяет свои стратегии независимо от выбора другого игрока.
Определение. Средний выигрыш игрока 1 в матричной игре с матрицей А выражается в виде математического ожидания его выигрышей
E (A, x, y) = = x A yT
Первый игрок имеет целью за
счёт изменения своих
Е (А, х, y).
Аналогичной должна быть ситуация и для игрока 2, т.е. нижняя цена игры должна быть
Е (А, х, y).
Подобно
играм, имеющим седловые точки в
чистых стратегиях, вводится следующее
определение: оптимальными смешанными
стратегиями игроков 1 и 2 называются
такие наборы хо, уо соответственно,
которые удовлетворяют
Е (А, х, y) = Е (А, х, y) = Е (А, хо, уо).
Величина Е (А, хо ,уо) называется при этом ценой игры и обозначается через u.
Имеется и другое определение оптимальных смешанных стратегий: хо, уо называются оптимальными смешанными стратегиями соответственно игроков 1 и 2, если они образуют седловую точку:
Е (А, х, уо) £ Е (А, хо, уо) £ Е (А, хо, у)
Оптимальные смешанные стратегии и цена игры называются решением матричной игры.
Основная теорема матричных игр имеет вид :
Теорема (о минимаксе). Для матричной игры с любой матрицей А величины
Е (А, х, y) и Е (А, х, y)
существуют и равны между собой.
1.2.3. Свойства решений матричных игр.
Обозначим через G (Х,Y,А) игру двух лиц с нулевой суммой, в которой игрок 1 выбирает стратегию х Î Х, игрок 2 – y Î U, после чего игрок 1 получает выигрыш А = А (х, y) за счёт игрока 2.
Определение. Стратегия х1 игрока 1 доминирует (строго доминирует) над стратегией х2, если
А (х1, y) ³ А (х2, y) (А (х1, y) > А (х2, y)), y Î U.
Стратегия y1 игрока 2 доминирует (строго доминирует) над стратегией y2, если
А (х, y1) £ А (х, y2) (А (х, y1) < А (х, y2)), х Î Х.
При этом стратегии х2 и y2 называются доминируемыми (строго доминируемыми).
Спектром смешанной стратегии игрока в конечной антагонистической игре называется множество всех его чистых стратегий, вероятность которых согласно этой стратегии положительна.
Свойство 1. Если чистая стратегия одного из игроков содержится в спектре некоторой его оптимальной стратегии, то выигрыш этого игрока в ситуации, образованной данной чистой стратегией и любой оптимальной стратегией другого игрока, равен значению конечной антагонистической игры.
Свойство
2. Ни одна строго доминируемая чистая
стратегия игрока не содержится в
спектре его оптимальной
Игра G¢ = (Х¢,Y¢,А¢) называется подыгрой игры G (Х,Y,А), если Х¢Ì Х, U¢Ì U, а матрица А¢ является подматрицей матрицы А. Матрица А¢ при этом строится следующим образом. В матрице А остаются строки и столбцы, соответствующие стратегиям Х¢ и U¢, а остальные “вычеркиваются”. Всё то что “останется” после этого в матрице А и будет матрицей А¢.
Свойство 3. Пусть G = (Х,Y,А) – конечная антагонистическая игра, G¢ = (Х х¢,Y,А) – подыгра игры G, а х¢ – чистая стратегия игрока 1 в игре G, доминируемая некоторой стратегией , спектр которой не содержит х¢. Тогда всякое решение (хо, yо, u) игры G¢ является решением игры G.
Свойство 4. Пусть G = (Х,Y,А) – конечная антагонистическая игра, G¢ = (Х,Y y¢,А) – подыгра игры G, а y¢ – чистая стратегия игрока 2 в игре G, доминируемая некоторой стратегией , спектр которой не содержит y¢.Тогда всякое решение игры G¢ является решением G.
Свойство 5. Если для чистой стратегии х¢ игрока 1 выполнены условия свойства 3, а для чистой стратегии y¢ игрока 2 выполнены условия свойства 4, то всякое решение игры G¢ = (Х х¢,Y y¢,А) является решением игры G = (Х,Y,А).
Свойство 6. Тройка (хо, yо, u) является решением игры G = (Х,Y,А) тогда и только тогда, когда (хо, yо, кu +а) является решением игры G(Х,Y,кА+а), где а – любое вещественное число, к > 0.
Свойство 7. Для того, чтобы хо = ( ) была оптимальной смешанной стратегией матричной игры с матрицей А и ценой игры u, необходимо и достаточно выполнение следующих неравенств
(j = ) (*)
Аналогично для игрока 2 : чтобы yо = ( , ..., , ..., ) была оптимальной смешанной стратегией игрока 2 необходимо и достаточно выполнение следующих неравенств:
(i = ) (**)
Из последнего свойства вытекает: чтобы установить, является ли предполагаемые (х, y) и u решением матричной игры, достаточно проверить, удовлетворяют ли они неравенствам (*) и (**). С другой стороны, найдя неотрицательные решения неравенств (*) и (**) совместно со следующими уравнениями
, (***)
получим решение матричной игры.
Таким образом, решение матричной игры сводится к нахождению неотрицательных параметров решений линейных неравенств (*) (**) и линейных уравнений (***). Однако это требует большого объёма вычислений, которое растёт с увеличением числа чистых стратегий игроков. (Например для матрицы 3 3 имеем систему из 6 неравенств и 2 уравнений). Поэтому в первую очередь следует, по возможности используя свойства 2 и 3, уменьшить число чистых стратегий игроков. Затем следует во всех случаях проверить выполнение неравенства
= .
Если оно выполняется, то игроки имеют чистые оптимальные стратегии (игрок 1 – чистую максиминная, а игрок 2 – чистую минимаксная). В противном случае хотя бы у одного игрока оптимальные стратегии будут смешанные. Для матричных игр небольшого размера эти решения можно найти, применяя свойства 1 – 5.
Замечание. Отметим, что исключение доминируемых (не строго) стратегий может привести к потере некоторых решений. Если же исключаются только строго доминируемые стратегии, то множество решений игры не изменится.