Задачи оптимального уравнения
Рефераты >> Математика >> Задачи оптимального уравнения

Тело считается успокоенным, если величина мо­дуля кинетического момента не превосходит задан­ной величины . Предположим, что в началь­ный момент времени t0 = 0 значение кинетического момента x(0) задано, причем

Пусть далее - первый момент времени, когда |х(Т)| = R. Управляющий момент u, подчи­ненный ограничению , требуется выбрать так, чтобы минимизировать время Т успокоения твердого тела. Используем для решения этой задачи метод динамического программирования. Соответ­ствующее уравнение в частных производных отно­сительно функции V(х) имеет вид

(3.21)

Вычисляя управление u, доставляющее минимум выражения в квадратных скобках (3.21), получим

(3.22)

Подставляя (3.22) в (3.21), получим нелинейное урав­нение в частных производных относительно функ­ции V

(3.23)

Будем искать решение задачи (3.23) в виде

,

где - скалярная функция скалярного аргумента , подлежащая определению. Подставляя это выражение для V в (3.23), получим соотношения, оп­ределяющие функцию :

Отсюда вытекает, что . Значит, опти­мальное управление u, успокаивающее тело и ми­нимальное время успокоения V(x) равны

Эти выражения показывают, что , то есть век­тор оптимального управления всегда максимален по величине и направлен против вектора кинетиче­ского момента.

3. НЕКОТОРЫЕ ЗАМЕЧАНИЯ О ВЫЧИСЛИТЕЛЬНЫХ И ПРИБЛИЖЕННЫХ МЕТОДАХ

В связи со значительными трудностями постро­ения аналитического решения задач оптимального управления исключительное значение приобрели различные приближенные и численные методы их исследования. В зависимости от алгоритми­ческой основы метода он может быть отнесен к той или иной группе. Охарактеризуем некоторые из них. В основе первой группы методов лежит воз­можность сведения задачи оптимального управле­ния к краевой задаче для системы дифференциаль­ных уравнений с помощью принципа максимума с последующим использованием различных алгорит­мов задания недостающих начальных условий. Ко второй группе численных методов относятся те, в которых ищется оптимальное управление с помо­щью итерационных процедур в пространстве управ­лений. При этом используются формулы для прира­щений критерия качества при вариации управления, приводящие либо к методам градиентного типа в пространстве управлений, либо к процедурам по­следовательных приближений. Третью группу со­ставляют численные процедуры, основанные на переборе в пространстве траекторий или методе динамического программирования. Кроме того, имеются методы, эффективные для конкретных классов систем, например для линейных, а также методы, основанные на сведении исходной задачи оптимального управления к задаче математическо­го программирования.

Опишем подробнее метод последовательных приближений, основанный на использовании ме­тода динамического программирования для задачи (3.4). Зададимся произвольным допустимым управле­нием (нулевым приближением к оптималь­ному), то есть управлением, при котором существу­ет решение уравнения (3.4) и выполнено ограничение . Решим далее линейное уравнение частных производных

Функция V0(t,х) представляет собой значение кри­терия качества при управлении u0 и начальном усло­вии х(t) = х. После того как функция V0 определена, найдем следующее приближение к опти­мальному управлению из соотношения

Продолжая указанный процесс, можно построить последовательность управлений и функций , которые в некоторых случаях (например, в линейно-квадратическом) сходятся к решению исходной задачи. Описанная процедура естествен­ным образом может быть использована и при при­менении принципа максимума к задаче (3.4). В этом случае необходимые условия оптимальности имеют вид краевой задачи (3.4)-(3.6). Зададимся опять неко­торым допустимым управлением . Далее най­дем при этом управлении соответствующую ему траекторию , решая уравнение (3.4) при . Наконец, подставим u0 и х0 в (3.5) и определим . Зная функции и , определим управление u1(t) из соотношения

.

Продолжая итерации, построим последовательнос­ти xi(t), ui(t), которые в некоторых ситуациях сходят­ся к решению исходной задачи оптимального управ­ления (3.4). Так, например, в применении к линейно-квадратичной задаче (3.10). (3.11) этот процесс приво­дит к следующей аппроксимации решения Р(t) не­линейного уравнения Рикатти (3.16) последователь­ностью Pi(t) решений линейных уравнений ()

При этом последовательность равномерно схо­дится к Р(t), причем .

4. ОПТИКО-МЕХАНИЧЕСКАЯ АНАЛОГИЯ В ИЗЛОЖЕНИИ ДЛЯ ШКОЛЬНИКОВ

Оптико-механическая аналогия - это сходство траектории движения частицы в потенциальном силовом поле с траекторией лучей в оптически не­однородной среде. Траектория материальной точки и траектория светового луча совпадают при опреде­ленном соответствии потенциальной энергии и пе­ременного в пространстве показателя преломления среды. Этот факт был теоретически открыт выдаю­щимся ирландским математиком и физиком У.Р. Га­мильтоном (1805-1865) в 1834 году и уже в на­шем столетии оказал влияние на установление связи между волновой оптикой и волновой (кванто­вой) механикой.


Страница: