Динамическое программирование

Автор работы: Пользователь скрыл имя, 04 Ноября 2012 в 18:02, реферат

Краткое описание

Принцип оптимальности Р.Э.Беллмана

Оптимальное поведение обладает тем свойством, что каким бы ни было первоначальное состояние системы и первоначальное решение, последующее решение должно определять оптимальное поведение относительно состояния, полученного в результате первоначального решения

Содержимое работы - 1 файл

Метод ДИНАМИЧЕСКОГО ПРОГРАММИРОВАНИЯ.ppt

— 460.00 Кб (Скачать файл)

 

 

 

 

Метод ДИНАМИЧЕСКОГО ПРОГРАММИРОВАНИЯ

 

 

 

 

Динамическое Программирование

 

 

 

 

  • решение задач поэтапно

 

 

 

 

  • принятие решения;
  • планирование

 

 

 

 

Принцип оптимальности  Р.Э.Беллмана

 

Оптимальное поведение  обладает тем свойством, что каким  бы ни было первоначальное  состояние системы и первоначальное  решение, последующее решение должно  определять оптимальное поведение  относительно состояния, полученного  в результате первоначального  решения

 

 

 

 

Задачи, решаемые методом  ДП

 

  • распределение дефицитных капитальных вложений между новыми направлениями их использования;
  • разработка правил управления запасами, устанавливающих момент пополнения  и размер пополняемого запаса;
  • разработка принципов календарного планирования производства и выравнивания занятости в условиях колеблющегося спроса на продукцию;
  • составление календарных планов текущего и капитального ремонтов оборудования и его замены;
  • выбор транспортных маршрутов или технологических способов изготовления изделий;
  • формирование последовательности развития коммерческой операции и т. д.

 

 

 

 

Постановка задачи ДП

 

  • требуется определить такое оптимальное управление Х*, переводящее  систему за n шагов из начального состояния S0 в конечное состояние Sn, при котором целевая функция принимает наибольшее (наименьшее) значение: F(S0, X*) → extr

 

 

 

 

Особенности математической  модели ДП

 

  • задача оптимизации формулируется как конечный многошаговый процесс управления;
  • оптимальное управление представляет собой арифметический вектор X*, определяемый последовательностью оптимальных пошаговых управлений: X* = (х*1, х*2, …, х*k, …, х*n), число которых и определяет количество шагов задачи;
  • критерий оптимальности определяется целевой функцией, которая является аддитивной и равна сумме целевых функций каждого шага:  F(Х)= ∑φ(Sk1, xk) k=1,n;
  • выбор управления хk на каждом шаге зависит только от состояния системы к этому шагу Sk1, и не влияет на предшествующие шаги (нет обратной связи);
  • состояние системы Sk после каждого шага управления зависит только от предшествующего состояния системы Sk-1 и этого управляющего воздействия хk (отсутствие последействия) и может быть записано в виде уравнения состояния системы: Sk= ƒk (Sk-1, хk), k = 1, n;
  • на каждом шаге управление хk зависит от конечного числа управляющих переменных, а состояние системы Sk зависит от конечного числа параметров

 

 

 

 

При выборе шагового  управления необходимо учитывать:

 

  • возможные исходы предыдущего шага    Sk-1 (условная оптимизация)
  • влияние управления хk на все оставшиеся до конца процесса шаги  (n - k) (безусловная оптимизация)

 

 

 

 

Задача о ранце

 

  • Постановка задачи. Требуется погрузить на баржу грузоподъемностью w=83 груз, состоящих из предметов четырех различных типов, таким образом, чтобы суммарная стоимость всего груза оказалась максимальной. При этом известны веса и стоимости четырех предметов равны соответственно р1=24, р2=22, р3=16, р4=10, v1=96, v2=85, v3=50, v4=20.

 

  • Математическая модель.

    Целевая функция – максимум стоимости груза, размещенного на барже:  maxƒ(X)=Σxivi i=1,n

    Ограничения:

    Σxipi ≤ w, i=1,n – вес груза не превышает грузоподъемность баржи;

    хi = 0, 1, 2,….. – физическая неделимость предметов

 

 

 

 

Решение задачи о ранце  методом ДП

 

  • Первый шаг оптимизации

максимальная стоимость  груза: ƒ1 (w) = max {x1v1}

условия: x1p1 ≤ w, x1=0, 1, 2…для нахождения max: x1 = [w/p1] и ƒ1(w) = [w/p1]v1

 

  • Второй шаг оптимизации

ƒ2(w) = max {x2v2 + ƒ1(w - x2p2)} 0 ≤ х2 ≤ [w/p2]

где (w - x2p2) – вес предметов первого типа, которые может взять баржа при условии, что предметов второго типа взяли x2;

ƒ1(w - x2p2) – максимальная стоимость предметов первого типа;

x2v2 – максимальная стоимость предметов второго типа

 

  • Третий шаг оптимизации

ƒ3(w) = max {x3v3 + ƒ2(w – x3p3)} 0 ≤ х3 ≤ [w/p3]

 

  • Четвертый шаг оптимизации

ƒ4(w) = max {x4v4 + ƒ3(w – x4p4)} 0 ≤ х4 ≤ [w/p4].

 

 

 

 

 

Решение задачи о ранце  методом ДП

 

1

 

181

 

46-47

 

0

 

288

 

72-87

 

0

 

96

 

24-45

 

1

 

277

 

70-71

 

1

 

85

 

22-23

 

0

 

192

 

48-69

 

0

 

0

 

0-21

 

x2

 

ƒ2(w)

 

w

 

x2

 

ƒ2(w)

 

w

 

Второй шаг оптимизации

 

3

 

288

 

72-87

 

1

 

96

 

24-47

 

2

 

192

 

48-71

 

0

 

0

 

0-23

 

x1

 

ƒ1(w)

 

w

 

x1

 

ƒ1(w)

 

w

 

Первый шаг оптимизации

 

 

 

 

Решение задачи о ранце  методом ДП

 

1

 

145

 

40-45

 

0

 

288

 

72-87

 

0

 

135

 

38-39

 

0

 

277

 

70-71

 

0

 

96

 

24-37

 

1

 

242

 

64-69

 

0

 

85

 

22-23

 

0

 

192

 

48-63

 

1

 

50

 

16-21

 

0

 

181

 

46-47

 

0

 

0

 

0-15

 

x3

 

ƒ3(w)

 

w

 

x3

 

ƒ3(w)

 

w

 

Третий шаг оптимизации

 

 

 

 

Решение задачи о ранце  методом ДП

 

0

 

146

 

40-45

 

1

 

308

 

82-87

 

1

 

135

 

38-39

 

0

 

288

 

72-81

 

1

 

116

 

34-37

 

0

 

277

 

71-71

 

0

 

96

 

24-33

 

0

 

242

 

64-69

 

0

 

85

 

22-23

 

1

 

212

 

58-63

 

0

 

50

 

16-21

 

0

 

192

 

48-57

 

1

 

20

 

10-15

 

0

 

181

 

46-47

 

0

 

0

 

0-9

 

x4

 

ƒ4(w)

 

w

 

x4

 

ƒ4(w)

 

w

 

Четвертый шаг оптимизации

 

 

 

 

Решение задачи о ранце  с помощью средств MS Excel (Поиск  решения)

 

 

 

 

Решение задачи о ранце  с помощью средств MS Excel (Поиск  решения)


Информация о работе Динамическое программирование