Оптимальне управління
 
а б в г д е ж з и й к л м н о п р с т у ф х ц ч ш щ ъ ы ь э ю я
 

Оптимальне управління

Оптимальне управління , розділ математики, що вивчає некласичні варіаційні завдання.

  Об'єкти, з якими має справу техніка, зазвичай забезпечені «кермом» — з їх допомогою чоловік управляє рухом. Математично поведінка такого об'єкту описується деякими рівняннями, куди входять і параметри, що управляють, характеризують положення «керма». Природно, виникає питання про відшукання найкращого (оптимального) в тому або іншому сенсі управління рухом. Наприклад, мова може йти про досягнення мети руху за мінімальний час. Це питання є завданням варіаційного числення . На відміну від класичних варіаційних завдань, де параметри, що управляють, міняються в деякої відкритої області (без кордону), теорія О. в. охоплює і той випадок, коли параметри, що управляють, можуть набувати і граничних значень. Остання обставина особлива істотно з прикладної точки зору, оскільки при управлінні технічним об'єктом саме положення «рулюючи» «на упорі» часто забезпечує О. в.

  Вже само зародження (на початку 50-х рр. 20 ст) О. в. є яскравим прикладом того, як запити практики з неминучістю породжують нові теорії. Для новітньої техніки і сучасного високомеханізованого і автоматизованого виробництва характерне прагнення вибирати найкращу програму дій, найраціональніше використовувати наявні ресурси. Саме ці конкретні технічні завдання стимулювали розробку теорії О. в., що виявилася математично дуже змістовною і такою, що дозволила вирішити багато завдань, до яких класичні методи були непридатні. Інтенсивний розвиток теорії О. в., у свою чергу, виявилося потужним чинником, сприяючим успішному вирішенню науково-технічних і народногосподарських завдань.

  Центральним результатом теорії О. в.. є принцип максимуму Понтрягина, що дає загальну необхідну умову оптимальності управління. Цей результат і пов'язані з ним дослідження, проведені Л.С. Понтрягиним і його співробітниками, послужили початковий пунктом розробки теоретичних, обчислювальних і прикладних аспектів теорії О. в. При вирішенні ряду завдань О. в. з успіхом використовуються ідеї методу динамічного програмування, основи якого розроблені американським ученим Р. Беллманом і його співробітниками.

  У загальних рисах завдання О. в. полягає в наступному. Розглянемо керований об'єкт, під яким розуміється деяка машина, прилад або процес, забезпечені «кермом». Маніпулюючи «кермом» (в межах наявних ресурсів управління), ми тим самим визначаємо рух об'єкту, управляємо їм. Например, технологічний процес здійснення хімічної реакції можна вважати керованим об'єктом, «кермом» якого є концентрації інгредієнтів, кількість каталізатора, підтримувана температура і ін. чинники, що впливають на перебіг реакції. Для того, щоб знати, як саме поводиться об'єкт при тому або іншому управлінні, необхідно мати закон руху, що описує динамічні властивості даного об'єкту і що встановлює для кожного обираного правила маніпулювання «кермом» еволюцію стану об'єкту. Можливості управляти об'єктом лімітуються не лише ресурсами управління, але і тим, що в процесі руху об'єкт не повинен потрапляти в стани, фізично недоступні або недопустимі з точки зору конкретних умов його експлуатації. Так, здійснюючи маневр судном, необхідно враховувати не лише технічній можливості самого судна, але і кордон фарватеру.

  Маючи справу з керованим об'єктом, завжди прагнуть так маніпулювати «кермом», щоб, виходячи з ясно початкового стану, у результаті достічь деякого бажаного стану. Наприклад, для запуску ІСЗ(штучний супутник Землі) необхідно розрахувати режим роботи двигунів ракети-носія, який забезпечить доставку супутника на бажану орбіту. Як правило, існує нескінченно багато способів управляти об'єктом так, щоб реалізувати мету управління. У зв'язку з цим виникає завдання знайти такий спосіб управління, який дозволяє досягти бажаного результату найкращим, оптимальним чином в сенсі певного критерію якості; у конкретних завданнях часто потрібно реалізувати мету управління за найменший можливий час або з мінімальною витратою пального, або з максимальним економічним ефектом і т.п.

  Як типовий можна привести керований об'єкт, закон руху якого описується системою звичайних диференціальних рівнянь

 =, (1)

i = 1..., n ,

де x 1 ..., x n — фазові координати, що характеризують стан об'єкту у момент часу t , а u 1 ,..., u r — параметри, що управляють. Управління об'єктом означає вибір параметрів, що управляють, як функцій часу

, j = 1..., r ,   (2)

  що є допустимими з точки зору наявних можливостей управління об'єктом. Наприклад, в прикладних завданнях часто потрібний, щоб в кожен момент часу крапка ( u 1 ..., u r ) належала заданій замкнутій безлічі U . Це остання обставина робить дане варіаційне завдання некласичної. Хай задані початковий ( x 1 0 ..., x n 0 ) і кінцевий ( x 1 1 ,..., x n 1 ) стани об'єкту (1). Про управління (2) говорять, що воно реалізує мету управління, якщо знайдеться такий момент часу t 1 > t 0 , що рішення ( x 1 ( t )..., x n ( t )) задачі

(3)

x i ( t 0 ) = x i 0 ,

i = 1..., n

задовольняє умові x i ( t 1 ) = x i 1 . Якість цього управління оцінюватимемо значенням функціонала

, (4)

де  — задана функція. Завдання О. в. полягає у відшуканні такого управління, що реалізовує мету, для якого функціонал (4) приймає найменше можливе значення. Т. о. математична теорія О. в. — це розділ математики, що розглядає некласичні варіаційні завдання відшукання екстремумів функціоналів на вирішеннях рівнянь, що описують керовані об'єкти, і управлінь, на яких реалізується екстремум.

  Сформулюємо для поставленого завдання необхідну умову оптимальності управління.

  Принцип максимуму Понтрягина. Хай вектор-функція

u = u ( t ) = ( u 1 ( t ),..., u r ( t )), t £ t 0 £ t 1 , (5)

– оптимальне управління, а вектор-функція

x = x ( t ) = ( x 1 ( t )..., x n ( t )), t £ t 0 £ t 1 ,

– відповідне йому рішення задачі (3). Розглянемо допоміжну лінійну систему звичайних диференціальних рівнянь

, (6)

до = 0, 1..., n ,

  і складемо функцію

Н (в, х , u ) =,

залежну, окрім х і u , від вектора в = (y 0 , y 1 ..., y n ). Тоді в лінійної системи (6) існує таке нетривіальне вирішення

в = в( t )= (y 0 ( t ), y 1 ( t )..., y n ( t )),

t £ t 0 £ t 1 ,

що для всіх точок t з відрізання [ t 0 , t 1 ], в яких функція (5) безперервна, виконано співвідношення

мах Н (в( t ), х ( t ), u ) = Н (в( t ), x ( t ), u ( t )) = 0,

                                   u Î U

причому y 0 (t) º const £ 0.

  До вигляду (1) зазвичай приводяться рівняння руху в разі керованих механічних об'єктів з кінцевим числом мір свободи. У багаточисельних реальних ситуаціях виникають і інші постановки завдань О. в., що відрізняються від приведеної вище: завдання з фіксованим часом, коли тривалість процесу заздалегідь задана, завдання з ковзаючими кінцями, коли про початковий і кінцевий стани відомо, що вони належать деякій безлічі, завдання з фазовими обмеженнями, коли рішення задачі (3) в кожен момент часу повинне належати фіксованій замкнутій безлічі, і ін. У завданнях механіки суцільних середовищ що характеризує стан керованого об'єкту величина х є функцією вже не лише часу, але і просторових координат (наприклад, величина х може описувати розподіл температури в телі в даний момент часу), а закон руху буде диференціальним рівнянням з приватними похідними. Часто доводиться розглядати керовані об'єкти, коли незалежна змінна набуває дискретних значень, а закон руху є системою кінечно-різницевих рівнянь. Нарешті окрему теорію складає О. в. стохастичними об'єктами.

  Літ.: Математична теорія оптимальних процесів, 2 видавництва. М., 1969 (авт. Л.С. Понтрягин, Ст Р. Болтянський, Р. Ст Гамкрелідзе, Е. Ф. Міщенко); Красовський Н. Н., Теорія управління рухом, М., 1968; Мойсеєвий Н. Н., Чисельні методи в теорії оптимальних систем, М., 1971.

  Н. Х. Розов.