Решение игр в смешанных стратегиях

Автор работы: Пользователь скрыл имя, 23 Января 2012 в 11:08, курсовая работа

Краткое описание

В процессе целенаправленной человеческой деятельности возникают ситуации, в которых интересы отдельных лиц (участников, групп, сторон) либо прямо противоположны, либо, не будучи непримиримыми, все же не совпадают. Простейшими и наиболее наглядными примерами таких ситуаций являются спортивные игры, арбитражные споры, военные учения (маневры), борьба между блоками избирателей за своих кандидатов, в международных отношениях - отстаивание интересов своего государства и т. п.

Содержимое работы - 1 файл

тпр.doc

— 247.00 Кб (Скачать файл)

МИНИСТЕРСТВО  ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ

Федеральное государственное образовательное  учреждение

высшего профессионального образования

«Чувашский  государственный университет имени  И.Н.Ульянова» 
 
 

Факультет дизайна и компьютерных технологий

Кафедра компьютерных технологий 
 
 
 
 

КУРСОВАЯ  РАБОТА

 Дисциплина: «Теория принятия решений» 

Тема: «Решение игр в смешанных стратегиях» 
 
 
 
 
 
 

                                                                     Выполнил: студент гр. ЗДиКТ 25-08 

                                                                                         Иванова А.В. 

                                                                    Проверил: Андреева Л.Н. 
 
 
 
 
 
 
 

Чебоксары

2011

Введение

     В процессе целенаправленной человеческой деятельности возникают ситуации, в которых интересы отдельных лиц (участников, групп, сторон) либо прямо противоположны,  либо, не будучи непримиримыми, все же не совпадают. Простейшими и наиболее наглядными примерами таких ситуаций являются спортивные игры, арбитражные споры, военные учения (маневры), борьба между блоками избирателей за своих кандидатов, в международных отношениях - отстаивание интересов своего государства и т. п. Здесь каждый из участников сознательно стремится добиться наилучшего результата за счет другого участника. Подобного рода ситуации встречаются и в различных сферах производственной деятельности.

     Игра (в математике) - это идеализированная математическая модель коллективного  поведения: несколько игроков влияют на исход игры, причем их интересы различны

     Один  из самых простых, но одновременно и  наиболее изученных и продвинутых  классов игр, на так называемых матричных играх. Матричной игрой (при двух участниках) называется игра, в которой выигрыши первого игрока (проигрыши второго игрока) задаются матрицей. Исследование матричных игр интересно потому, что к ним могут быть приближенно сведены многие игры более общего вида.

1. КЛАССИФИКАЦИЯ  ИГР

     Классификацию игр можно проводить: по количеству игроков, количеству стратегий, характеру взаимодействия игроков, характеру выигрыша, количеству ходов, состоянию информации и т.д.

     В зависимости от количества игроков  различают игры двух и  n  игроков. Первые из них наиболее изучены. Игры трёх и более игроков менее исследованы из-за возникающих принципиальных трудностей и технических возможностей получения решения. Чем больше игроков - тем больше проблем.

     По  количеству стратегий игры делятся  на конечные и бесконечные. Если в  игре все игроки имеют конечное число  возможных стратегий, то она называется конечной. Если же хотя бы один из игроков имеет бесконечное количество возможных стратегий игра называется бесконечной.

     По  характеру взаимодействия игры делятся  на:

1)  бескоалиционные: игроки не имеют права вступать в соглашения, образовывать коалиции;

2)   коалиционные (кооперативные) – могут вступать в коалиции.

     В кооперативных играх коалиции наперёд  определены.

     По  характеру выигрышей игры делятся  на: игры с нулевой суммой (общий  капитал всех игроков не меняется, а перераспределяется между игроками; сумма выигрышей всех игроков равна нулю) и игры с ненулевой суммой.

     По  виду функций выигрыша игры делятся  на: матричные, биматричные, непрерывные, выпуклые, сепарабельные, типа дуэлей и др.

     

     Матричная игра – это конечная игра двух игроков  с нулевой суммой, в которой задаётся выигрыш  игрока 1 в виде матрицы (строка матрицы соответствует номеру применяемой стратегии игрока 2, столбец – номеру применяемой стратегии игрока 2; на пересечении строки и столбца матрицы находится выигрыш игрока 1, соответствующий применяемым стратегиям).

     Для матричных игр доказано, что любая  из них имеет решение и оно  может быть легко найдено путём  сведения игры к задаче линейного  программирования.

     Биматричная игра – это конечная игра двух игроков  с ненулевой суммой, в которой выигрыши каждого игрока задаются матрицами отдельно для соответствующего игрока (в каждой матрице строка соответствует стратегии игрока 1, столбец – стратегии игрока 2, на пересечении строки и столбца в первой матрице находится выигрыш игрока 1, во второй матрице – выигрыш игрока 2.)

     Для биматричных игр также разработана  теория оптимального поведения игроков, однако решать такие игры сложнее, чем  обычные матричные.

     Непрерывной считается игра, в которой функция  выигрышей каждого игрока является непрерывной в зависимости от стратегий. Доказано, что игры этого класса имеют решения, однако не разработано практически приемлемых методов их нахождения.

     Если  функция выигрышей  является выпуклой, то такая игра называется выпуклой. Для них  разработаны приемлемые методы решения, состоящие в отыскании чистой оптимальной стратегии (определённого числа) для одного игрока и вероятностей применения чистых оптимальных стратегий другого игрока. Такая задача решается сравнительно легко.

     2. Решение игр в смешанных стратегиях

     Если  игра не имеет седловой точки, то применение чистых стратегий не дает оптимального решения игры. Так, в примере 1 α ≠ β, седловая точка отсутствует. В таком случае можно получить оптимальное решение, случайным образом чередуя чистые стратегии.

     Смешанной стратегией SA игрока А называется применение чистых стратегий A1, A2, ..., Am с вероятностями p1, p2, ..., pi, ..., pm причем сумма вероятностей равна 1: Смешанные стратегии игрока А записываются в виде матрицы

или в  виде строки SA = (p1, p2, ..., pi, ..., pm) Аналогично смешанные стратегии игрока В обозначаются:

, или,  SB = (q1, q2, ..., qi, ..., qn),

где сумма  вероятностей появления стратегий равна 1:

     Чистые  стратегии можно считать частным  случаем смешанных и задавать строкой, в которой 1 соответствует чистой стратегии. На основании принципа минимакса определяется оптимальное решение (или решение) игры: это пара оптимальных стратегий S*A , S*B в общем случае смешанных, обладающих следующим свойством: если один из игроков придерживается своей оптимальной стратегии, то другому не может быть выгодно отступать от своей. Выигрыш, соответствующий оптимальному решению, называется ценой игры v. Цена игры удовлетворяет неравенству:

α ≤ v ≤ β  

где α и β — нижняя и верхняя цены игры. Справедлива следующая основная теорема теории игр — теорема Неймана. Каждая конечная игра имеет по крайней мере одно оптимальное решение, возможно, среди смешанных стратегий. Пусть S*A = (p*1, p*2, ..., p*i, ..., p*m) и S*B = (q*1, q*2, ..., q*i, ..., q*n) — пара оптимальных стратегий. Если чистая стратегия входит в оптимальную смешанную стратегию с отличной от нуля вероятностью, то она называется активной.

     Справедлива теорема об активных стратегиях: если один из игроков придерживается своей оптимальной смешанной стратегии, то выигрыш остается неизменным и равным цене игры v, если второй игрок не выходит за пределы своих активных стратегий.

     Эта теорема имеет большое практическое значение — она дает конкретные модели нахождения оптимальных стратегий при отсутствии седловой точки.

     Рассмотрим  игру размера 2×2, которая является простейшим случаем конечной игры. Если такая игра имеет седловую точку, то оптимальное решение — это пара чистых стратегий, соответствующих этой точке.  
Игра, в которой отсутствует седловая точка, в соответствии с основной теоремой теории игр оптимальное решение существует и определяется парой смешанных стратегий S*A = (p*1, p*2) и S*B = (q*1, q*2).

     Для того чтобы их найти, воспользуемся  теоремой об активных стратегиях. Если игрок А придерживается своей оптимальной стратегии S'A, то его средний выигрыш будет равен цене игры v, какой бы активной стратегией ни пользовался игрок В. Для игры 2×2 любая чистая стратегия противника является активной, если отсутствует седловая точка. Выигрыш игрока А (проигрыш игрока В) — случайная величина, математическое

     

ожидание (среднее значение) которой является ценой игры. Поэтому средний выигрыш игрока А (оптимальная стратегия) будет равен v и для 1-й, и для 2-й стратегии противника.

Пусть игра задана платежной матрицей

     Средний выигрыш игрока А, если он использует оптимальную смешанную стратегию , а игрок В — чистую стратегию B1 (это соответствует 1-му столбцу платежной матрицы Р), равен цене игры v: a11 p*1+ a21 p*2= v. Тот же средний выигрыш получает игрок А, если 2-й игрок применяет стратегию B2, т.е. a12 p*1+ a22 p*2= v. Учитывая, что p*1+ p*2= 1, получаем систему уравнений для определения оптимальной стратегии S'A и цены игры v:

 

Решая эту систему, получим оптимальную  стратегию

 

и цену игры

 

     Применяя  теорему об активных стратегиях при  отыскании SВ*- оптимальной стратегии  игрока В, получаем, что при любой  чистой стратегии игрока А (А1 или  А2) средний проигрыш игрока В равен  цене игры v, т.е.

(3.9)

Тогда оптимальная  стратегия определяется формулами:

(3.10)

     Применим  полученные результаты для отыскания оптимальных стратегий для игры, рассмотренной в примере.2.

Пример 1

     Решение. Игра "поиск" задана платежной матрицей без седловой точки:

     Поэтому ищем решение в смешанных стратегиях; для игрока А средний выигрыш равен цене игры v (при B1 и B2); для игрока В средний проигрыш равен цене игры v (при A1 и B2). Системы уравнений в данном случае имеют вид:

Информация о работе Решение игр в смешанных стратегиях