Справочник от Автор24
Поделись лекцией за скидку на Автор24

Динамическое программирование

  • 👀 317 просмотров
  • 📌 284 загрузки
Выбери формат для чтения
Загружаем конспект в формате pdf
Это займет всего пару минут! А пока ты можешь прочитать работу в формате Word 👇
Конспект лекции по дисциплине «Динамическое программирование» pdf
Динамическое программирование Рассмотрим некоторый управляемый экономический процесс. В результате управления система переводится из начального состояния конечное . При этом управление проходит в в шагов, и решение принимается последовательно на каждом шаге, то есть управление представляет собой поша- говых управлений. На каждом шаге необходимо определить два типа переменных: переменную состояния системы переменную управления Переменная состояния система на ; (управляющее воздействие). определяет, в каких состояниях может оказаться - ом шаге. В зависимости от состояния системы на этом шаге можно принять некоторое управление, характеризующееся переменной управления , такое управление должно удовлетворять определѐнным условиям и называется допустимым. Применение управляющего воздействия в новое состояние и даѐт некоторый результат на - ом шаге приводит систему . При этом из всех воз- можных управлений на рассматриваемом шаге выбирают оптимальное, то есть такое, для которого выполняется принцип Беллмана (результат управления с того по - - ый шаг должен быть оптимальным). Числовая характеристика такого результата называется функцией Беллмана и зависит от номера шага и от состояния системы . Таким образом, необходимо определить оптимальную стратегию управления , переводящую систему из начального состояния ное состояние в конеч- , при которой целевая функция (функция Беллмана) принимает наибольшее (наименьшее) значение, то есть . Оптимальную стратегию управления можно получить, если найти сначала оптимальную стратегию управления на - ом шаге, затем на двух последних ша- гах, затем на трѐх последних шагах и так далее, вплоть до первого шага. 1 Для того, чтобы найти оптимальное решение на последнем, - ом шаге, нужно сделать все возможные предположения о том, как мог завершиться последний шаг, и с учѐтом этого выбрать управление ное значение функции результата управление обеспечивающее оптималь- . При этом говорят, что оптимальное на последнем шаге определяется функцией Беллмана: или . Дальнейшие вычисления производят согласно рекуррентному соотношению, связывающему функцию Беллмана на каждом шаге с той же функцией, вычисленной на предыдущем шаге: или . Эта часть исследования называется условной оптимизацией. Следующий этап – безусловная оптимизация. Учитывая, что известно начальное состояние системы , можно найти оптимальное управление на первом шаге, то есть решение, которое доставляет оптимальный результат на следующем – втором шаге. В результате такого управления система перейдет в другое состояние , зная которое, аналогичным образом находят оптимальное управление на втором шаге и так далее – до последнего – го шага. 2
«Динамическое программирование» 👇
Готовые курсовые работы и рефераты
Купить от 250 ₽
Решение задач от ИИ за 2 минуты
Решить задачу
Помощь с рефератом от нейросети
Написать ИИ

Тебе могут подойти лекции

Смотреть все 938 лекций
Все самое важное и интересное в Telegram

Все сервисы Справочника в твоем телефоне! Просто напиши Боту, что ты ищешь и он быстро найдет нужную статью, лекцию или пособие для тебя!

Перейти в Telegram Bot