Задачи оптимального уравненияРефераты >> Математика >> Задачи оптимального уравнения
1.2. Критерий качества (минимизируемый функционал)
Управление системой (3.1) осуществляется для достижения некоторых целей, которые формально записываются в терминах минимизации по u функционалов J, определяемых управлением u и траекторией х, где
(3.3)
Здесь F и заданные скалярные функции. Задача (3.1). (3.3) именуется задачей О.Больца; если , то задачей А.Майера и, наконец, задачей Лагранжа при .
1.3. Ограничения на траекторию
В некоторых реальных ситуациях траектория системы не может принадлежать тем или иным частям пространства . Указанное обстоятельство находит отражение в ограничении вида ), где G(t) -заданная область в . В зависимости от конкретного типа этих ограничений выделяют различные классы задач управления. В задачах с фиксированными концами начальное состояние и конечное состояние х(Т) заданы. Если же x(t0) (или х(Т)) не задано, то получаем задачу со свободным левым (правым) концом. Задача с подвижными концами - это задача, в которой моменты t0 и T фиксированы, а векторы х(t0) и х(Т) принадлежат соответственно областям G(t0) и G(T). В ряде случаев ограничения носят интегральный характер и имеют вид
Если в задаче (3.1), (3.3) начальное положение x(t0) и конечное х(Т) заданы, моменты начала движения t0 и окончания T свободны, функция и , то получаем задачу о переводе системы (3.1) из положения x(t0) в положение х(Т) за минимально возможное время. Подобного рода задачи именуются задачами оптимальными по быстродействию.
1.4. Ограничения на управление
Информационные ограничения на управление зависят от того, какая именно информация о системе (3.1) доступна при выработке управляющего воздействия. Если вектор x(t) недоступен измерению, то оптимальное управление ищется в классе функций u(t), зависящих только от t. В этом случае оптимальное управление именуется программным. Если же вектор х(t) известен точно при , то оптимальное управление ищется в классе функционалов и называется синтезом оптимального управления (или управлением по принципу обратной связи). Здесь означает всю траекторию движения на отрезке . Отметим, что принцип обратной связи является одним из центральных принципов кибернетики. Техническим примером реализации принципа обратной связи являются центробежные регуляторы И.И. Ползунова (1766) и Дж. Уатта (1784), авиационный автопилот Д. Ольховского (1912) и братьев Сперри (1914), гидравлический усилитель Л. Фарко (1873).
Кроме информационных ограничений возможен и другой тип ограничений, обусловленный ограниченностью ресурсов управления, имеющих вид , где - заданное множество.
Подчеркнем, что для детерминированных задач (то есть задач, в которых уравнения движения, критерий качества и ограничения известны точно) оптимальное значение критерия качества (3.3), реализуемое в классе программных управлений и управлений по принципу обратной связи, одно и то же.
2. УСЛОВИЯ ОПТИМАЛЬНОСТИ
2.1. Принцип максимума
Принцип максимума соответствует принципу Вейерштрасса и методу канонических уравнений Гамильтона в классическом вариационном исчислении. Сформулируем необходимые условия оптимальности в форме принципа максимума для задач Майера
(3.4)
Здесь - заданное множество, х0 - заданное начальное положение системы. Введем в рассмотрение скалярную функцию Н и вектор сопряженных переменных с помощью соотношений
(3.5)
где штрих - знак транспонирования.
Предположим, что u(t) - оптиматьное управление, а х(t) и - соответствующие траектория и вектор сопряженных переменных, удовлетворяющие уравнениям (3.4), (3.5). Тогда функция достигает своего максимума по точке u(t)
(3.6)
Найдем из соотношения (3.6) зависимость u от то есть то есть
(3.7)
Далее подставим (3.7) в (3.4), (3.5). В результате получим краевую задачу для системы обыкновенных дифференциальных уравнений относительно функций x(t) и , среди решений которой только и может находиться оптимальная траектория. Если оптимальная траектория x(t) и вектор найдены, то оптимальное управление дается выражением (3.7). Отметим, однако, что поскольку соотношения (3.4) - (3.6) суть лишь необходимые условия оптимальности, то необходимо дополнительное обоснование оптимальности траектории и управления, найденных из соотношений (3.4)-(3.6).
2.2. Метод динамического программирования
Метод динамического программирования является аналогом метода Гамильтона-Якоби, в котором изучается все поле оптимальных траекторий. Опишем применение метода динамического программирования для задачи (3.4). Выберем и зафиксируем произвольный момент времени и рассмотрим вспомогательную задачу управления (3.4) на отрезке [t, T]. Обозначим через минимальное значение критерия качества во вспомогательной задаче при начальном условии , где х - произвольный вектор из . При некоторых предположениях функция V(t, x) удовлетворяет соотношениям