Упражнение 1.8

Провести возможные упрощения платежной матрицы в следующих задачах:

1) 2)
3) 4)

1.2.2. Элементарные приемы решения игр 2´2

Пусть дана матричная (2´2)-игра . Может оказаться, что эта игра имеет седловую точку, если это так, то никакой проблемы нет. Предположим, что игра не имеет седловой точки. Отсюда следует, что оптимальные стратегии и должны иметь положительные компоненты. Далее, если цена игры есть , то

или

(1.10)

Так как , по предположению, является оптимальной стратегией, то каждое из двух выражений в скобках в левой части (1.10) меньше или равно (почему?). допустим, что одно из этих выражений меньше , т.е. допустим, что

(1.11)

(1.12)

Тогда, поскольку и , левая часть в (1.10) будет строго меньше . Отсюда следует, что оба выражения, заключенные в скобки в (1.10), должны быть равны . Значит,

(1.13)

(1.14)

Аналогично можно показать, что

zx (1.15)

(1.16)

Тем самым мы установили в частном случае справедливость следующей важной теоремы.

Теорема. Если один из игроков применяет свою оптимальную смешанную стратегию, то его выигрыш равен цене игры вне зависимости от того, с какими вероятностями будет применять второй игрок стратегии, вошедшие в оптимальную (в том числе и чистые стратегии).

Теперь присоединив к уравнениям (1.15), (1.16) соотношение

(1.17)

можем решить эту систему трех уравнений с тремя неизвестными и найти оптимальные вероятности и цену игры по формулам

(1.18)

Аналогично, составив систему из уравнений (1.13), (1.14)

(1.19)

находим оптимальную смешанную стратегию для игрока В.

Для геометрического анализа проведенных рассуждений воспользуемся следующим построением. В системе координат xOy отложим на оси Ox отрезок единичной длины, каждой точке х которого будет отвечать некоторая смешанная стратегия (рис. 1).

Так точке для которой отвечает стратегия точке для которой - стратегия и так далее. По оси ординат будем откладывать выигрыши игрока А. При использовании стратегии выигрыш равен если второй игрок применяет если второй игрок применяет Следовательно, получим две точки Соответственно, при использовании стратегии выигрыши могут быть (при ) или (при ); они показаны двумя точками на перпендикуляре, восстановленном в точке Средний выигрыш при любом сочетании стратегий (с вероятностями ) и стратегии второго игрока равен и геометрически определяется ординатой, восстановленной в точке х до пересечения с отрезком Аналогично, средний выигрыш при использовании стратегии будет определяться ординатами точек, лежащих на отрезке

Ординаты точек, лежащих на ломаной (показанной жирной линией), характеризуют минимальный выигрыш игрока А при использовании им любой смешанной стратегии х (на участке против стратегии а на участке - против стратегии ).

Следуя принципу максимина, получаем, что оптимальное решение игры определяет точка М, в которой этот минимальный выигрыш достигает максимума. Ей отвечает на оси абсцисс оптимальная стратегия а ее ордината равна цене игры По цене игры сразу находится оптимальная стратегия игрока В из уравнений (1.13) и (1.19).

На рисунке 1 можно показать нижнюю и верхнюю цены игры .

Если матрица игры имеет седловую точку, то получим следующие разновидности графического изображения игры.

1) Решением игры для игрока А является чистая стратегия (для игрока В – стратегия ), т.е. . Игра имеет седловую точку , равную цене игры (рис. 2).

2) Решение игры соответствует точке и задается векторами и . Игра имеет седловую точку Стратегия доминируемая и явно невыгодна для игрока В (рис. 3).


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: