Семинар Отдела динамических систем,
23 января 2002 г.

Покомпонентная инвариантность задачи оптимального управления

Кукушкин А.П., Буханов Д.В.

Рассматривается управляемая механическая система, движение которой описывается уравнениями Лагранжа второго рода. Силы, действующие на систему зависят от со стояния системы (положения и скорости) и от управляющих воздействий (обобщенных сил), которые можно выбирать по ходу движения. Ограничения на возможные управления зависят от состояния системы и определены системой равенств и неравенств. При известных начальных условиях выбранный закон управления определяет управляемый процесс (отрезок времени, закон управления, траектория ). Процесс переводит систему из начального состояния в конечное состояние. Допустимые процессы удовлетворяют уравнениям движения и ограничениям на управление. Каждому процессу ставится в соответствие интегральный критерий качества и рассматривается следующий класс задач оптимального управления.

Задача. В фиксированный начальный момент времени известно состояние системы и ограничения на конечный момент времени отсутствуют. Требуется среди всех допустимых процессов, переводящих управляемую систему из заданного начального состояния в заданное конечное состояние найти такой, который доставляет наименьшее значение критерию качества.

Компонентами задачи являются конфигурационное пространство, лагранжиан и обобщенные силы управляемой системы, функции, определяющие ограничения на управление, подинтегральная функция критерия качества. При рассмотрении необходимых условий оптимальности можно ограничиться рассмотрением задачи в некоторой локальной системе координат, не рассматривая конфигурационное пространство в целом.

К рассматриваемым задачам применяется принцип максимума Понтрягина в форме, адаптированной для задач управления механическими системами. Принцип максимума записывается в лагранжевой форме, при этом вспомогательные переменные принципа максимума (множители Лагранжа) можно рассматривать как некоторую специфичную вариацию оптимальной траектории.

Из структуры присоединенных уравнений принципа максимума следует, что если компоненты задачи не зависят от какой-либо координаты, то соответствующие множители Лагранжа постоянны. Обобщение этой ситуации приводит к понятию симметрии задачи оптимального управления. Если задача оптимального управления в определенном смысле ''инвариантна'' относительно действия однопараметрической группы преобразований, то для задачи существует ''закон сохранения'' -- сохраняет свое значение некоторая функция, зависящая от времени, фазовых координат и множителей Лагранжа. Такое свойство является следствием вариационной структуры уравнений принципа максимума (теорема Нётер в классическом вариационном исчислении). Вводится понятие покомпонентной инвариантности задачи оптимального управления относительно действия группы преобразований расширенного конфигурационного пространства. Результативность разработанного подхода иллюстрируется на примере задачи быстродействия для механической системы.