Стратегии теории игр в современных экономических условиях
Считаются известными всевозможные состояния П1, П2, ..., Пn природы П, которые она проявляет случайным образом независимо от действий игрока А, не противодействуя злонамеренно его стратегиям. Природа может находиться только в одном из отмеченных состояний, но в каком именно - неизвестно, хотя в некоторых случаях могут быть известны лишь вероятности этих состояний.
Известны также возможные стратегии A1, A2, ..., An игрока А и его выигрыши при каждой из стратегий и каждом из состояний природы Пj. Эти выигрыши можно расположить в виде матрицы выигрышей (Таблица 1).
Таблица 1 - Матрица выигрышей
Пj Ai |
П1 |
П2 |
... |
Пn |
|
А1 |
а11 |
а12 |
... |
а1n |
|
(aij) = |
А2 |
а21 |
a22 |
... |
a2n |
... |
... |
... |
... |
... |
|
Аm |
аm1 |
am2 |
... |
amn |
|
qj |
q1 |
q2 |
... |
qn |
В нижней строке матрицы указаны вероятности qj состояний природы Пj, j = 1, ..., n.
Предположим, что игрок А, не зная состояния природы, выбрал стратегию Аi. Если природа приняла состояние Пj, то выигрыш игрока А будет аij. Но если бы игрок А заранее знал, что природа примет состояние Пj, то он выбрал бы стратегию Аi0, при которой достигается наибольший выигрыш аi0j, т.е.
(1)
Разность
(2)
между выигрышем игрока А при заранее известном ему состоянии природы Пj и выигрышем аij при незнании игроком А состояния природы называется риском при стратегии Аi и состоянии природы Пj. Таким образом, риск rij есть та часть наибольшего выигрыша при состоянии природы Пj, которую игрок А не выиграл, применяя стратегию , по причине незнания состояния природы.
Таблица 2 - Матрица рисков
Пj Аi |
П1 |
П2 |
... |
Пn |
|
A1 |
r11 |
r12 |
... |
r1n |
|
(rij) = |
A2 |
r21 |
r22 |
... |
r2n |
... |
... |
... |
... |
... |
|
Am |
rm1 |
rm2 |
... |
rmn |
|
qj |
q1 |
q2 |
... |
qn |
В последней строке указаны вероятности состояний природы qj, j = 1, …, n. Так как (правое неравенство следует из (1)), то из (2) получаем, что.
Вероятность состояния природы Пj является очевидно вероятностью выигрыша и риска при каждой стратегии Ai, i = 1, …, m.Поэтому каждую стратегию можно интерпретировать как дискретную случайную величину, которая может принимать значения, равные выигрышам , …, или рискам , …, с соответствующими вероятностями , …, .
Задача игрока А состоит в выборе из возможных стратегий Ai, ..., Am оптимальной. Таким образом, речь идет о решении задачи в чистых стратегиях ([1], с. 502, 508). Оптимальность стратегии понимают в различных смыслах и выбирают ее по различным критериям.
Цель настоящей статьи - предложить некоторую общую схему формирования критериев выбора оптимальных стратегий, на основе которой можно выделить некоторые классы критериев, включающие в себя отмеченные классические критерии и дающие возможность получать новые критерии оптимальности.
Теоретическая часть
Результат игры в общем случае зависит от трех числовых параметров: выигрышей а игрока А, рисков r, которые появляются при выборе игроком А той или иной стратегии, и вероятностей q состояний природы. Желание "свернуть" эти три параметра в один показатель приводит к некоторой числовой функции, зависящий от этих трех параметров. Обозначим ее G(a, r, q) и назовем функцией игры. Характер зависимости функции игры G от а, r и q мотивируется логикой применяемого критерия. Значения
функции игры назовем показателями игры. Эти показатели образуют матрицу игры.
выигрыш матрица критерий оптимальный
Таблица 3 - Матрица игры
Пj Ai |
П1 |
П2 |
... |
Пn |
|
A1 |
G11 |
G12 |
... |
G1n |
|
(Gij) = |
A2 |
G21 |
G22 |
... |
G2n |
... |
... |
... |
... |
... |
|
Am |
Gm1 |
Gm2 |
... |
Gmn |
Критерий векторного аргументаjпредполагает задание некоторой числовой функциизначение которой назовем показателем стратегии Ai.
Затем среди показателей Gi стратегий Ai выбирается экстремальный. Для одних критериев это максимальное значение: Ext = max, а для других минимальное: Ext = min.
Если Ext = max, то показатель Gi назовем показателем оптимальности стратегии Ai; если же Ext = min, то Gi назовем показателем неоптимальности стратегии Ai.
Оптимальной по критерию называется стратегия Ai0, для которой достигается экстремум показателя Gi , т.е.
Применяя описанную схему, сформируем некоторые классы критериев.
Максиминные критерии (крайнего пессимизма)
Для этих критериев
(3)
а показатели стратегий Ai определяются следующим образом:
и являются, в силу (3), показателями оптимальности стратегий.
Таким образом, Gi является наихудшим показателем игры при стратегии Ai. Отсюда следует, что функция игры G(a, r, q) должна быть неубывающей по выигрышу а и невозрастающей по риску r.
На показатели игры также оказывают влияние вероятности состояний природы q. Так, например, если наихудший, т.е. наименьший выигрыш аij при стратегии Ai имеет достаточно малую вероятность qj, то считать его практически наименьшим уже нецелесообразно. Чтобы этот выигрыш оставался и практически наименьшим, он должен иметь достаточно большую вероятность. С рисками обстоит все наоборот: чтобы наихудший, т.е. наибольший риск rij при стратегии Ai оставался практически наибольшим, его вероятность должна быть также достаточно большой. Это говорит о том, что функция игры должна невозрастать по вероятности q.
Итак, логика максиминного критерия определяет характер поведения функции игры в зависимости от выигрыша а, риска r и вероятности q:
G(a, r, q) Ú по a; Ø по r; Ø по q.
Для удобства различий в дальнейшем для максиминного критерия обозначим функцию игры G через W, показатели игры Gij через Wij, показатели оптимальности Gi стратегий Ai через Wi.
Таким образом, для максиминного критерия функция игры
W(a,r,q) Ú по a; Ø по r; Ø по q, (4)
показатели игры
показатели оптимальности стратегий
Оптимальной по максиминному критерию считается стратегия Ai0, для которой
Максиминный критерий является критерием крайнего пессимизма лица, выбирающего стратегию, так как ориентирует его на наихудшее для него проявление состояний природы и как следствие - на весьма осторожное поведение при принятии решения.
Конкретная функция игры W(a,r,q) может быть выбрана по-разному, но с непременным требованием обладания свойствами (4).
Примерами максиминных критериев с конкретными функциями игры W(a,r,q) могут служить следующие критерии:
3.1. W(a,r,q) = a;
.2. W(a,r,q) = (1-q)a;
.3. W(a,r,q) = a-r;
.4. W(a,r,q) = (1-q)a-qr.
То, что каждая их этих функций обладает свойствами (4), можно проверить по знаку частных производных.
В критерии 3.1 показателями игры являются выигрыши: , а потому он не учитывает ни рисков, ни вероятностей состояний природы. Критерий 3.1 является критерием Вальда ([1], с. 504; [3], с. 91; [5], с. 56), позволяющим обосновать выбор решения в условиях полной неопределенности, т.е. в условиях незнания вероятностей состояний природы. Критерий 3.2 учитывает выигрыши и вероятности состояний природы, но не учитывает риски. В критерии 3.3 учитываются выигрыши и риски без учета вероятностей состояний природы. И наконец, в критерии 3.4 учитываются выигрыши, риски и вероятности состояний природы.
- Минимаксные критерии (крайнего пессимизма)
- Максимаксные критерии (крайнего оптимизма)
- Миниминные критерии (крайнего оптимизма)
- Критерии максимизации взвешенного среднего показателя оптимальности стратегий
- Критерии минимизации взвешенного среднего показателя неоптимальности стратегий
- Максиминно-максимаксные критерии
- Минимаксно-миниминные критерии