Задачи оптимального уравненияРефераты >> Математика >> Задачи оптимального уравнения
Тело считается успокоенным, если величина модуля кинетического момента не превосходит заданной величины . Предположим, что в начальный момент времени t0 = 0 значение кинетического момента x(0) задано, причем
Пусть далее - первый момент времени, когда |х(Т)| = R. Управляющий момент u, подчиненный ограничению , требуется выбрать так, чтобы минимизировать время Т успокоения твердого тела. Используем для решения этой задачи метод динамического программирования. Соответствующее уравнение в частных производных относительно функции V(х) имеет вид
(3.21)
Вычисляя управление u, доставляющее минимум выражения в квадратных скобках (3.21), получим
(3.22)
Подставляя (3.22) в (3.21), получим нелинейное уравнение в частных производных относительно функции V
(3.23)
Будем искать решение задачи (3.23) в виде
,
где - скалярная функция скалярного аргумента , подлежащая определению. Подставляя это выражение для V в (3.23), получим соотношения, определяющие функцию :
Отсюда вытекает, что . Значит, оптимальное управление u, успокаивающее тело и минимальное время успокоения V(x) равны
Эти выражения показывают, что , то есть вектор оптимального управления всегда максимален по величине и направлен против вектора кинетического момента.
3. НЕКОТОРЫЕ ЗАМЕЧАНИЯ О ВЫЧИСЛИТЕЛЬНЫХ И ПРИБЛИЖЕННЫХ МЕТОДАХ
В связи со значительными трудностями построения аналитического решения задач оптимального управления исключительное значение приобрели различные приближенные и численные методы их исследования. В зависимости от алгоритмической основы метода он может быть отнесен к той или иной группе. Охарактеризуем некоторые из них. В основе первой группы методов лежит возможность сведения задачи оптимального управления к краевой задаче для системы дифференциальных уравнений с помощью принципа максимума с последующим использованием различных алгоритмов задания недостающих начальных условий. Ко второй группе численных методов относятся те, в которых ищется оптимальное управление с помощью итерационных процедур в пространстве управлений. При этом используются формулы для приращений критерия качества при вариации управления, приводящие либо к методам градиентного типа в пространстве управлений, либо к процедурам последовательных приближений. Третью группу составляют численные процедуры, основанные на переборе в пространстве траекторий или методе динамического программирования. Кроме того, имеются методы, эффективные для конкретных классов систем, например для линейных, а также методы, основанные на сведении исходной задачи оптимального управления к задаче математического программирования.
Опишем подробнее метод последовательных приближений, основанный на использовании метода динамического программирования для задачи (3.4). Зададимся произвольным допустимым управлением (нулевым приближением к оптимальному), то есть управлением, при котором существует решение уравнения (3.4) и выполнено ограничение . Решим далее линейное уравнение частных производных
Функция V0(t,х) представляет собой значение критерия качества при управлении u0 и начальном условии х(t) = х. После того как функция V0 определена, найдем следующее приближение к оптимальному управлению из соотношения
Продолжая указанный процесс, можно построить последовательность управлений и функций , которые в некоторых случаях (например, в линейно-квадратическом) сходятся к решению исходной задачи. Описанная процедура естественным образом может быть использована и при применении принципа максимума к задаче (3.4). В этом случае необходимые условия оптимальности имеют вид краевой задачи (3.4)-(3.6). Зададимся опять некоторым допустимым управлением . Далее найдем при этом управлении соответствующую ему траекторию , решая уравнение (3.4) при . Наконец, подставим u0 и х0 в (3.5) и определим . Зная функции и , определим управление u1(t) из соотношения
.
Продолжая итерации, построим последовательности xi(t), ui(t), которые в некоторых ситуациях сходятся к решению исходной задачи оптимального управления (3.4). Так, например, в применении к линейно-квадратичной задаче (3.10). (3.11) этот процесс приводит к следующей аппроксимации решения Р(t) нелинейного уравнения Рикатти (3.16) последовательностью Pi(t) решений линейных уравнений ()
При этом последовательность равномерно сходится к Р(t), причем .
4. ОПТИКО-МЕХАНИЧЕСКАЯ АНАЛОГИЯ В ИЗЛОЖЕНИИ ДЛЯ ШКОЛЬНИКОВ
Оптико-механическая аналогия - это сходство траектории движения частицы в потенциальном силовом поле с траекторией лучей в оптически неоднородной среде. Траектория материальной точки и траектория светового луча совпадают при определенном соответствии потенциальной энергии и переменного в пространстве показателя преломления среды. Этот факт был теоретически открыт выдающимся ирландским математиком и физиком У.Р. Гамильтоном (1805-1865) в 1834 году и уже в нашем столетии оказал влияние на установление связи между волновой оптикой и волновой (квантовой) механикой.