Предположим, что в задаче принятия решений имеется S стационарных стратегий. Пусть PS и RS - матрицы переходных (одношаговых) вероятностей и доходов, соответствующие применяемой стратегии, s = 1,2,…, S. Метод перебора включает четыре шага:
Шаг 1. Вычисляем - ожидаемый доход, получаемый за один этап при стратегии s для заданного состояния i, i = 1,2,…,m.
Шаг 2. Вычисляем - долгосрочные стационарные вероятности матрицы переходных вероятностей PS, соответствующие стратегии s. Эти вероятности (если они существуют) находятся из уравнений:
где
Шаг 3. Вычисляем E S - ожидаемый доход за один шаг (этап) при выбранной стратегии s:
.
Шаг 4. Оптимальная стратегия s* определяется из условия, что