Динамическое программирование
Реферат, 04 Ноября 2012, автор: пользователь скрыл имя
Краткое описание
Принцип оптимальности Р.Э.Беллмана
Оптимальное поведение обладает тем свойством, что каким бы ни было первоначальное состояние системы и первоначальное решение, последующее решение должно определять оптимальное поведение относительно состояния, полученного в результате первоначального решения
Содержимое работы - 1 файл
Метод ДИНАМИЧЕСКОГО ПРОГРАММИРОВАНИЯ.ppt
— 460.00 Кб (Скачать файл)
Метод ДИНАМИЧЕСКОГО ПРОГРАММИР
Динамическое Программирование
- решение задач поэтапно
- принятие решения;
- планирование
Принцип оптимальности Р.Э.Беллмана
Оптимальное поведение
обладает тем свойством, что каким
бы ни было первоначальное
состояние системы и
Задачи, решаемые методом ДП
- распределение дефицитных капит
альных вложений между новыми н аправлениями их использования; - разработка правил управления запасами, устанавливающих момент пополнения и размер пополняемого запаса;
- разработка принципов календарного планирования производства и выравнивания занятости в условиях колеблющегося спроса на продукцию;
- составление календарных планов текущего и капитального ремонтов оборудования и его замены;
- выбор транспортных маршрутов или технологических способов изготовления изделий;
- формирование последовательности развития коммерческой операции и т. д.
Постановка задачи ДП
- требуется определить такое опт
имальное управление Х*, переводящее систему за n шагов из начального состояния S0 в конечное состояние Sn, при котором целевая функция принимает наибольшее (наименьшее) значение: F(S0, X*) → extr
Особенности математической модели ДП
- задача оптимизации формулирует
ся как конечный многошаговый п роцесс управления; - оптимальное управление представляет собой арифметический вектор X*, определяемый последовательностью оптимальных пошаговых управлений: X* = (х*1, х*2, …, х*k, …, х*n), число которых и определяет количество шагов задачи;
- критерий оптимальности определяется целевой функцией, которая является аддитивной и равна сумме целевых функций каждого шага: F(Х)= ∑φ(Sk−1, xk) k=1,n;
- выбор управления хk на каждом шаге зависит только от состояния системы к этому шагу Sk−1, и не влияет на предшествующие шаги (нет обратной связи);
- состояние системы Sk после каждого шага управления зависит только от предшествующего состояния системы Sk-1 и этого управляющего воздействия хk (отсутствие последействия) и может быть записано в виде уравнения состояния системы: Sk= ƒk (Sk-1, хk), k = 1, n;
- на каждом шаге управление хk зависит от конечного числа управляющих переменных, а состояние системы Sk зависит от конечного числа параметров
При выборе шагового
управления необходимо
- возможные исходы предыдущего ш
ага Sk-1 (условная оптимизация) - влияние управления хk на все оставшиеся до конца процесса шаги (n - k) (безусловная оптимизация)
Задача о ранце
- Постановка задачи. Требуется погрузить на баржу грузоподъемностью w=83 груз, состоящих из предметов четырех различных типов, таким образом, чтобы суммарная стоимость всего груза оказалась максимальной. При этом известны веса и стоимости четырех предметов равны соответственно р1=24, р2=22, р3=16, р4=10, v1=96, v2=85, v3=50, v4=20.
- Математическая модель.
Целевая функция – максимум стоимости груза, размещенного на барже: maxƒ(X)=Σxivi i=1,n
Ограничения:
Σxipi ≤ w, i=1,n – вес груза не превышает грузоподъемность баржи;
хi = 0, 1, 2,….. – физическая неделимость предметов
Решение задачи о ранце методом ДП
- Первый шаг оптимизации
максимальная стоимость груза: ƒ1 (w) = max {x1v1}
условия: x1p1 ≤ w, x1=0, 1, 2…для нахождения max: x1 = [w/p1] и ƒ1(w) = [w/p1]v1
- Второй шаг оптимизации
ƒ2(w) = max {x2v2 + ƒ1(w - x2p2)} 0 ≤ х2 ≤ [w/p2]
где (w - x2p2) – вес предметов первого типа, которые может взять баржа при условии, что предметов второго типа взяли x2;
ƒ1(w - x2p2) – максимальная стоимость предметов первого типа;
x2v2 – максимальная стоимость предметов второго типа
- Третий шаг оптимизации
ƒ3(w) = max {x3v3 + ƒ2(w – x3p3)} 0 ≤ х3 ≤ [w/p3]
- Четвертый шаг оптимизации
ƒ4(w) = max {x4v4 + ƒ3(w – x4p4)} 0 ≤ х4 ≤ [w/p4].
Решение задачи о ранце методом ДП
1
181
46-47
0
288
72-87
0
96
24-45
1
277
70-71
1
85
22-23
0
192
48-69
0
0
0-21
x2
ƒ2(w)
w
x2
ƒ2(w)
w
Второй шаг оптимизации
3
288
72-87
1
96
24-47
2
192
48-71
0
0
0-23
x1
ƒ1(w)
w
x1
ƒ1(w)
w
Первый шаг оптимизации
Решение задачи о ранце методом ДП
1
145
40-45
0
288
72-87
0
135
38-39
0
277
70-71
0
96
24-37
1
242
64-69
0
85
22-23
0
192
48-63
1
50
16-21
0
181
46-47
0
0
0-15
x3
ƒ3(w)
w
x3
ƒ3(w)
w
Третий шаг оптимизации
Решение задачи о ранце методом ДП
0
146
40-45
1
308
82-87
1
135
38-39
0
288
72-81
1
116
34-37
0
277
71-71
0
96
24-33
0
242
64-69
0
85
22-23
1
212
58-63
0
50
16-21
0
192
48-57
1
20
10-15
0
181
46-47
0
0
0-9
x4
ƒ4(w)
w
x4
ƒ4(w)
w
Четвертый шаг оптимизации
Решение задачи о ранце с помощью средств MS Excel (Поиск решения)
Решение задачи о ранце с помощью средств MS Excel (Поиск решения)