Семинар Отдела динамических систем
ИММ УрО РАН
1.10.2014

Неантагонистические дифференциальные игры со случайными моментами выхода игроков из игры

С.Ю. Костюнин

В докладе рассматриваются дифференциальные игры, в которых продолжительность игры не задана заранее, а является реализацией некоторой случайной величины. Такие игры, получившие название дифференциальных игр со случайной продолжительностью, были впервые рассмотрены в работе Л.А. Петросяна и Н.В. Мурзова "Теоретико-игровые проблемы в механике" в 1966 году.

В рассматриваемых дифференциальных играх выигрыш игрока задается в виде математического ожидания интегрального функционала. Получены достаточные условия представления выигрыша игрока в упрощенной форме.

В качестве примера рассмотрена дифференциальная игра управления вредными выбросами со случайной продолжительностью, получены необходимые условия существования равновесия по Нэшу. Найдено в явном виде решение, удовлетворяющее необходимым условиям, и исследованы его свойства. Построена кооперативная дифференциальная игра на основе игры управления вредными выбросами, в аналитическом виде найдены вектор Шепли, выбранный в качестве принципа оптимальности, и процедура распределения дележа, которая гарантирует динамическую устойчивость вектора Шепли.

Далее вводится в рассмотрение новый класс дифференциальных игр двух лиц со случайной продолжительностью и различными моментами выхода из игры её участников. В предлагаемой постановке каждый игрок имеет свой собственный момент выхода из игры. Выигрыш игрока определяется как математическое ожидание суммы интегрального функционала и терминальной составляющей, которую получает игрок, дольше остающийся в игре. Предполагается, что моменты выхода из игры для игроков распределены на конечном интервале. Доказываются леммы, с помощью которых последовательно производится упрощение ожидаемого интегрального выигрыша и ожидаемого терминального выигрыша. Доказывается теорема, дающая упрощенную форму для всего функционала выигрыша.

Выводится и исследуется система уравнений Гамильтона – Якоби – Беллмана. Доказывается теорема, дающая достаточное условие существования состоятельного позиционного равновесия по Нэшу в данном классе дифференциальных игр.

В завершении рассматривается частный случай игры, в которой в качестве терминальной составляющей выигрыша используется функция значения (функция Беллмана) в задаче оптимального управления со случайной продолжительностью для соответствующего игрока. Это соответствует математической модели, в которой оставшийся в игрок переходит из дифференциальной игры в задачу оптимального управления.

Проведено построение состоятельного позиционного равновесия по Нэшу в дифференциальной игре со случайной продолжительностью, моделирующей совместную разработку невозобновляемого ресурса. Последовательно найдены оптимальное управление игроков в соответствующих задачах оптимального управления и равновесные стратегии игроков в рассматриваемой игре. Полученные равновесные стратегии анализируются для случая усечённого экспоненциального распределения. Исследуется зависимость оптимального поведения игроков от параметров распределения их моментов окончания разработки невозобновляемого ресурса.