д-дак	дал-дан	дао-два	две-дво	дву-деб	дев-дей	дек-дел	дем-ден
део-дер	дес-деф	дех-джа	джв-джо	джу-диа	диб-дим	дин-дир	дис-диф
дих-доб	дов-дол	дом-дом	дон-дор	дос-дре	држ-дуб	дув-дур	дус-дэт
дэф-дят

Динамічне програмування

Динамічне програмування, розділ математики, присвячений теорії і методам вирішення багатокрокових завдань оптимального управління .

В Д. п. для керованих процесів серед всіх можливих управлінь шукається те, яке доставляє екстремальне (найменше або найбільше) значення цільової функції, — деякій числовій характеристиці процесу. Під многошаговостью розуміють або багатоступінчасту структуру процесу, або розбиття управління на ряд послідовних етапів (кроків), відповідних, як правило, різним моментам часу. Т. о., в назві «Д. п.» під «програмуванням» розуміють «ухвалення рішень», «планерування», а слово «динамічне» вказує на істотну роль часу і порядку виконання операції в даних процесах і методах.

Методи Д. п. є складеній частиною методів, використовуваних в дослідженні операцій (див. Операцій дослідження ), і застосовуються як в завданнях оптимального планерування, так і при вирішенні різних технічних проблем (наприклад, в завданнях визначення оптимальних розмірів рівнів багатоступінчастих ракет, в завданнях оптимального проектування прокладки доріг і ін.).

Хай, наприклад, процес управління деякою системою складається з m кроків (етапів), на i -м кроку управління y_i переводить систему із стану x_i-1 в новий стан x_i, яке залежить від x_i-1 і y_i :

x_i = x_i ( y_i, x_i-1 ).

Т. о., управління в ₁, в ₂ ..., у_m переводить систему з початкового стану x ₀ в кінцеве х_m . Потрібно вибрати x ₀ і в ₁ ..., у_m так, щоб цільова функція F = å^m _i=1 j _i ( x _i-1, y_i ) досягла максимального значення F* . Основним методом Д. п. є зведення загального завдання до ряду простіших екстремальних завдань. Користуючись так званим принципом оптимальності, сформульованим американським математиком Р. Беллманом, легко отримати основне функціональне рівняння:

і ( до = 2 ..., m - 1)

f₁ ( x₀ ) = F* ,

де

( до = 1 ..., m ).

Т. о., метод Д. п. приводить до необхідності вирішення цієї рекурентної системи функціональних рівнянь. У процесі рішення послідовність етапів проходітся двічі: у приведеному варіанті рекурентної системи вперше від кінця до початку (знаходяться оптимальні значення F* і х*₀ ), другий раз — від початку до кінця (знаходяться оптимальні управління в *₁ ..., у*_m ).

Методи Д. п. знаходять вживання не лише в дискретних, але і в безперервних керованих процесах, наприклад в таких процесах, коли рішення треба приймати в кожен момент деякого інтервалу часу. Д. п. дало новий підхід до завдань варіаційного числення .

Хоча метод Д. п. істотно спрощує вихідні завдання, проте безпосереднє його вживання, як правило, зв'язане з громіздкими обчисленнями. Для подолання цих труднощів розробляються наближені методи Д. п.

Літ.: Беллман Р., Динамічне програмування, пер.(переведення) з англ.(англійський), М., 1960; Хедлі Дж., Нелінійне і динамічне програмування, пер.(переведення) з англ.(англійський), М., 1967.

Ст Р. Кишень.

Динамічне програмування

Наступні слова