Семинар Отдела динамических систем,
17.11.2004

Об одном подмножестве оптимальных позиционных стратегий

Д.А.Серков

Рассматривается конфликтно управляемая система, описываемой обыкновенным дифференциальным уравнением с терминальным показателем качества. Основные понятия и формализация следуют работам [1,2].

В указанных работах, в работах [3,4] и многих других исследованиях [см.библиографию в 1-4] главное внимание уделено обеспечению наилучшего значения показателя качества в случаях наиболее эффективного противодействия помехи. Это особенно актуально для задач, в которых содержательно помеха формируется исходя из целей, противоположных целям управления. И в этом случае реализация помехи будет как раз той, для эффективного противодействия которой выстроено оптимальное позиционное управление. В частности, если зафиксировать эту реализацию и рассмотреть соответствующую задачу оптимального управления, то построенная оптимальная позиционная стратегия даст решение задачи синтеза оптимального управления. Если же реализация помехи отлична от оптимальной, то показатель качества окажется заведомо менее благоприятен для стороны, распоряжающейся помехой [1].

Известно также, что оптимальная позиционная стратегия формируется, вообще говоря, не единственным способом. И если результат управления в случае оптимального поведения помехи всегда будет одинаков для одинаковых начальных позиций (и равен цене соответствующей дифференциальной игры), то результат для одной и той же неоптимальной помехи будет различным для различных оптимальных стратегий. Это обстоятельство делает формально корректной задачу о поиске позиционной стратегии, качество которой оценивается не только в зависимости от начальной позиции, но и в зависимости от реализовавшейся помехи. Легко проверить, что результат, достигаемый позиционной стратегией при заданной реализации помехи не может быть лучше описанного выше результата в задаче оптимального управнения, возникающей при фиксации такой неоптимальной помехи. Величина показателя качества случившаяся в этой задаче оптимального управнения может рассматриваться в качестве эталона, отклонение от которого нежелательно, и близость к которому является показателем качества выбраной позиционной стратегии. Оптимальной в этой постановке будет названа стратегия, у которой максимум отклонения от указанного ``эталона'' во всех начальных позициях и при всех реализациях помехи минимален. Такие стратегии назовем равномерными. Заметим, что равномерная стратегия может оказаться не оптимальной в смысле [1].

Содержательным мотивом для изучения задачи управления в такой постановке может быть предположение о следующих механизмах формирования помехи. Во-первых, помеха может формироватся некоторым случайным процессом. Тогда исходная задача трансформируется в задачу минимизации того или иного функционала от случайной величины значения исходного показателя качества.

Во-вторых, помеха может формироваться детерминировано и осознано, но не имееть антагонистического характера. Например, сторона, формирующая помеху, исходит из иного терминального показателя качества движения, который не известен первому игроку.

В качестве идеальной можно представить ситуацию, когда существует равномерная стратегия при всех начальных положениях и для всех релизаций помехи доставляющая результат равный эталонному. Можно проверить, что тогда она будет и оптимальной позиционной стратегией. Исследованию условий существования такой позиционной стратегии посвящена настоящая работа.

ЛИТЕРАТУРА

Н.Н.Красовский, А.И.Субботин Позиционные дифференциальные игры Москва, Наука, 1974.
Н.Н.Красовский Управление динамической системой Москва, Наука, 1985.
А.И.Субботин, А.Г.Ченцов Оптимизация гарантии в задачах управления Москва, Наука, 1981.
А.И.Субботин Обобщенные решения уравнений в частных производных первого порядка. Перспективы динамической оптимизации Москва, Ижевск, Институт компьютерных исследований, 2003.