Автор работы: Пользователь скрыл имя, 24 Декабря 2011 в 17:47, реферат
Принцип максимума как необходимое условие оптимизации управляемых про-
цессов не гарантирует оптимальности. Он только позволяет отсекать из множества до-
пустимых заведомо неоптимальные процессы, когда его условия не выполняются, а ос-
тальные процессы, удовлетворяющие принципу максимума, следует воспринимать лишь
как кандидаты в оптимальные. Даже если такой кандидат один, из содержательных ус-
ловий задачи должно вытекать знание о наличии оптимального процесса. Тогда этот
процесс и будет оптимальным. Однако при строгих рассуждениях это не убедительно,
нужны более точные аналитические оценки.
Согласно условию оптимальности (3.16) функция Гамильтона в любой момент t либо должна принимать свой внутренний (локальный) максимум, и тогда должно выполняться условие либо максимум, максимум достигается на границе, тогда где n – направление нормали к границе.
Из выражения для функции Гамильтона видно, что но , поэтому .
Таким образом, процедура применения принципа максимума к задаче (3.4) состоит в следующем.
Сначала вводятся п сопряженных переменных = ( 1,..., n), затем строится функция Гамильтона:
После этого определяются функции u(t), (t), y(t), удовлетворяющие условиям:
Если кроме уравнений движения есть и другие ограничения, то они обычным образом включаются в функцию Лагранжа, а, следовательно, и в функцию Гамильтона.
Принцип максимума дает лишь необходимые условия оптимальности. Действительно, оптимальная траектория состоит из некоторых участков управляющих траекторий, определенных по этому принципу.
Принцип максимума
как необходимое условие
цессов не гарантирует оптимальности. Он только позволяет отсекать из множества до-
пустимых заведомо неоптимальные процессы, когда его условия не выполняются, а ос-
тальные процессы, удовлетворяющие принципу максимума, следует воспринимать лишь
как кандидаты в оптимальные. Даже если такой кандидат один, из содержательных ус-
ловий задачи должно вытекать знание о наличии оптимального процесса. Тогда этот
процесс и будет оптимальным. Однако при строгих рассуждениях это не убедительно,
нужны более точные аналитические оценки. Они существуют и формулируются в виде
следующей теоремы.
6.2. Принцип максимума Понтрягина
Соотношения (см. разд. 6.1), выполняющиеся на оптимальном процессе, с учетом ог-
раничений в постановке задачи (нет ограничений на состояние, независимость множества
допустимых управлений от состояния), позволили определить необходимые условия опти-
мальности процесса (x*(t), u*(t)). Полученные соотношения могут быть использованы для
“сужения” исходного множества M допустимых процессов путем выделения из него только
тех процессов, которые удовлетворяют необходимым условиям. Совокупность приведенных
условий, как правило, дает возможность выделить единственную траекторию x*(t) из мно-
жества допустимых траекторий. Если при этом еще известно (например, из содержательной
постановки задачи) о существовании оптимальной траектории, то тем самым x*(t) и отве-
чающее ему управление u*(t) и есть решение задачи оптимального управления.
Комплекс условий, которому должен удовлетворять оптимальный процесс, называ-
ется принципом максимума Понтрягина (ниже поясним суть названия). Сформулируем
его в виде теоремы.
Теорема 6.1 (принцип максимума Понтрягина). Пусть (x*(t), u*(t)) – оптимальный
процесс в задаче оптимального управления (6.1) – (6.5). Тогда существует вектор-функция
ψ(t) = (ψ1(t), ψ2(t),..., ψn(t)), удовлетворяющая вместе с данным процессом следующим
условиям:
1. Функция H(t, x, ψ, u) (см. определение 6.9) достигает максимального значения по
u при x= x*(t), ψ= ψ(t) на значении u = u*(t) при всех t∈ [0, T] (см. соотношение (6.12)).
2. Переменные ψ(t) удовлетворяют системе дифференциальных уравнений (6.16).
3. В конечный момент времени t = T оптимальная траектория удовлетворяет усло-
виям трансверсальности (6.18).
Таким образом, система уравнений (6.1) и (6.17) может быть записана в следующей
форме
dx
dt
i
= f i(t, x, u);
d
dt
i ψ
= -
∂ ψ
∂
H t x t u t
xi
( , , ( ), *( ) ⏐x*(t), i = 1, 2,..., n. (6.19)
Пример 6.1. Проиллюстрируем применение алгоритма принципа максимума на
простейшей задаче оптимального управления – линейной со свободным правым концом,
когда
при t=T конечные #______/_условия
не заданы
Рассмотрим постановки и решения ряда задач оптимального управления для не-
прерывных и многошаговых (дискретных) процессов. Необходимые условия оптимизации
в форме Лагранжа-Понтрягина являются аппаратом оптимизации процесса. В
соответствии с теоремой 6.2 дополнительного доказательства оптимальности во всех
рассматриваемых случаях не требуется, так как в разд. 8.1. решается линейная задача, а в
разд. 8. 2 и 8. 3 –
две содержательно сходные
непрерывных процессов с выпуклыми функционалами и линейными ограничениями.
Для линейной задачи краевая задача решается точно и оказывается возможным
провести некоторый качественный анализ еще до получения решения; для многошаговых
и непрерывных процессов краевые задачи решаются приближенно численным методом
прямой прогонки (см. разд. 1.6).
Две последние задачи, содержательно между собой очень близкие, приводятся вме-
сте для сопоставления техники математических выкладок и расчетных схем. Это дает воз-
можность увидеть сходство и различие в однотипных постановках задач и подходах к их
решению.
Модель развития экономики: магистральная теория
В качестве практического примера применения достаточных условий оптимально-
сти (см разд. 3.1) рассмотрим однопродуктовую экономическую систему, характеризую-
щуюся в каждый момент времени t (время непрерывное) набором переменных
X, Y, C, K, L, I,
где X – интенсивность выпуска валового продукта в рассматриваемый период;
Y – интенсивность конечного продукта, идущего на непроизводственное потребление;
C – величина непроизводственного потребления;
K – капитал (объем основных производственных фондов - ОПФ);
L – трудовые ресурсы (живая сила);
I – инвестиции.
Эти переменные взаимосвязаны. Прежде всего имеет место условие баланса в каж-
дый момент времени
X = aX + Y, 0 < a < 1.
ОДНОПРОДУКТОВАЯ МАКРОЭКОНОМИЧЕСКАЯ МОДЕЛЬ
ОПТИМАЛЬНОГО РАЗВИТИЯ ЭКОНОМИКИ
62
В свою очередь, конечный продукт распределяется на валовые инвестиции и не-
производственное потребление
Y = I + C.
Валовые инвестиции расходуются на прирост капитала и восстановление ОПФ за
счет амортизационных отчислений:
K
dt
I = dK + μ ,
где μ - коэффициент амортизации.
Тогда
I K
dt
dK = − μ ,
или
dt
dK = (1 - a) (1 - u)Х - μK , (5.8)
где u =
У
С - доля непроизводственного потребления:
0 ≤ u ≤ 1. (5.9)