Решение матричных игр в чистых стратегиях

Целью участников любой матричной игры является выбор наиболее выгодных стратегий, доставляющих игроку А максимальный выигрыш, а игроку В минимальный проигрыш. Стратегию игрока А называют оптимальной, если при ее применении выигрыш игрока А не уменьшается, какими бы стратегиями не пользовался игрок В. Оптимальной для игрока В называют стратегию, при использовании которой проигрыш игрока В не увеличивается, какие бы стратегии не применял игрок А.

Предположим, что игроку А надлежит сделать свой выбор. Анализируя платежную матрицу (см. таблицу 7.1), он для каждой чистой стратегии A_i () сначала найдет минимальное значение α_i ожидаемого выигрыша: (), а затем из всех α_i выделит наибольшее и выберет соответствующую ему чистую стратегию . Это и будет наиболее предпочтительная (гарантирующая) в данных условиях стратегия игрока А. Ее называют максиминной, поскольку она отвечает величине

(7.1)

Число α, определяемое по формуле (7.1), называется нижней чистой ценой игры (максимином). Оно показывает, какой минимальный выигрыш может получить игрок А, правильно применяя свои чистые стратегии при любых действиях игрока В.

В свою очередь, игрок В, стремясь минимизировать проигрыш, при выборе наиболее предпочтительной стратегии использует принцип осторожности так: сначала он для каждой чистой стратегии В_j () найдет максимально возможный проигрыш (), а затем среди β_j выберет минимальное значение , которому и будет соответствовать искомая чистая стратегия . Ее называют минимаксной, так как она соответствует величине

(7.2)

Число β, определяемое по формуле (7.2), называется верхней чистой ценой игры (минимаксом). Оно показывает, какой максимальный проигрыш может быть у игрока В при правильном выборе им своих чистых стратегий независимо от действий игрока А.

Если в матричной игре нижняя и верхняя чистые цены совпадают, т.е. α = β, то эта игра имеет седловую точку в чистых стратегиях и чистую цену игры ν = α = β. Оптимальными для игроков будут соответственно максиминная и минимаксная стратегии, а чистой ценой игры – седловой элемент платежной матрицы. Если игра седловой точки не имеет, то решение игры затрудняется

Таким образом, правильно используя чистые стратегии, игрок А обеспечит себе выигрыш не меньше α, а игрок В в результате правильного применения своих чистых стратегий не позволит игроку А выиграть больше, чем β.

Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:

17 18 19 20 21 22 23

Теория естественного права

Лексическое и грамматическое значение слова

Расчет нормальной концентрации

Соучастие в преступлении: понятие и признаки. Виды соучастников и формы соучастия

НЭП: ПРИЧИНЫ, СУЩНОСТЬ И ПРОТИВОРЕЧИЯ

Среднее квадратическое отклонение

Самый сильный аргумент, почему эволюция человека не могла быть