Машинне переведення
 
а б в г д е ж з и й к л м н о п р с т у ф х ц ч ш щ ъ ы ь э ю я
 

Машинне переведення

Машинне переведення , автоматичне переведення, переклад текстів з однієї мови на іншій за допомогою автоматичних пристроїв. Розрізняють два напрями досліджень по М. п.: 1) прикладне (промислова реалізація М. п. науково-технічних текстів, автоматизація інформаційної справи і т. п.), 2) теоретичне (моделювання мовної діяльності людей як один з методів її дослідження; розробка математичних формалізмов для лінгвістичних описів; пошук алгоритмів переробки мовних об'єктів; дослідження співвідношення між людських мисленням і машинами і т. п.).

загрузка...

  Система М. п. зазвичай складається з лінгвістичного опису вхідної і вихідної мов (тобто автоматичних словників і граматика формальних всіх рівнів) і алгоритму (тобто інструкції по використанню цих словників і граматик, орієнтованою лише на їх форму), на основі якого виконується саме переведення. Повний процес М. п. складається з наступних основних етапів: 1) аналіз тексту на вхідній мові (пошук слів в словнику, морфологічний і синтаксичний аналіз — моделюється розуміння тексту); 2) перетворення (перехід від структури тексту на вхідній мові до структури тексту на вихідній мові); 3) синтез тексту на вихідній мові (синтаксичне і морфологічне оформлення тексту — моделюється побудова тексту). У реальних системах М. п. всі ці етапи можуть тісно переплітатися, а деякі з них бути відсутнім.

  Алгоритм М. п. зазвичай виконується універсальною цифровою обчислювальною машиною. Отриманий в результаті М. п. текст може редагуватися людиною — «редактором» поста, який усуває помилки і неоднозначності в переведенні. От як виглядає в загальних межах приклад перекладу з англійської мови на російський пропозиції He was seen at 6 o’clock по вказаних етапах. На етапі аналізу встановлюється, що he — підмет, was seen — присудок (дієслово see в Past Indefinite дійсного способу пасивної застави), а at 6 o’clock — обставина часу. На етапі перетворення англійським словам і словосполукам ставляться у відповідність російські переведення: he — «він», see — «бачити», 6 o’clock — «шість годин»; оскільки дієслово «бачити» не уживається в пасивному стані, англійська пасивна конструкція перетвориться в російську невизначено-особисту конструкцію: «він» стає прямим доповненням («його») до присудка — дієслову «бачити» недосконалого вигляду дійсного способу дійсної застави в минулому часі і множині. На етапі синтезу виробляються відмінкові і прийменникові показники синтаксичних зв'язків між словами, зокрема привід at отримує переведення «в + знахідний відмінок» як показник обставини часу, «він» як пряме доповнення отримує ознака «знахідний відмінок» і тому подібне Потім визначається порядок слів, після чого утворюються потрібні форми слів, так що виходить «Його бачили о 6 годині». Якщо у вихідній пропозиції замість he був би займенник it, то при переведенні (без врахування попередніх пропозицій) виникла б неоднозначність: «Його бачили о 6 годині» (якщо it — це, наприклад, plane — «літак»), «Її бачили в 6 годинника» (якщо it — це, наприклад, rocket — «ракета»), «Це бачили о 6 годині» (якщо it — деяка подія або явище). Людина-постредактор може вибрати з цих варіантів один — правильний.

  Проблема М. п. знаходиться на стику теоретичної і прикладної лінгвістики (у тому числі структурної і статистичної лінгвістики), математичної лінгвістики, теорії і практики програмування і автоматичного програмування для обчислювальних машин, інформатики . Паралельно с М. п. розвивалася автоматизація лінгвістичних досліджень. Методи М. п., розроблені для природних мов, знаходять вживання в завданнях, пов'язаних з штучними мовами (мови автоматичного програмування, мови інформаційні ).

  Вперше ідея М. п. була висловлена французьким винахідником Ж. Арцруні і незалежно радянським винахідником П. П. Смірновим-Троянським в 1933. З появою в 40—50-х роках електронних обчислювальних машин роботи по М. п. почалися в США і СРСР. У 1954 в університеті (Вашингтон, США) Джорджтауна був проведений перший експеримент по М. п. з російської мови на англійську. У СРСР перші досліди М. п. були проведені в 1955—56 (англо-російський і французько-російський М. п.). Надалі дослідження по М. п. розвернулися в багатьох інших країнах. Головні вхідні мови — англійський, російський, французький; вихідні — ті ж, а також німецький, японський, чеський, в'єтнамський і деякі інші. Початковий період робіт над проблемами М. п. (приблизно до 1961) характеризувався підвищеною увагою до технічних і програмістам питань; орієнтацією на конкретні пари мов (так зване бінарне переведення) розробкою лише морфологічних і синтаксичних правил переведення; формулюванням правил переведення відразу у вигляді алгоритмічних розпоряджень; видачею, як правило, лише одного варіанту переведення для кожної пропозиції. Надалі при розробці М. п. стали істотно використовуватися результати сучасної структурної і математичної лінгвістики. Основна увага стала звертатися на розробку і вдосконалення загальних схем М. п., придатних для самих різних мов. Правила обробки тексту для конкретних мов стали формулюватися переважно не як алгоритмічного розпорядження, а як умови, що накладаються на правильний результат обробки. Процес М. п. реалізується алгоритмом досить універсального типа, який виявляє і здійснює всі можливі способи обробки тексту на даному етапі, що приводять до допустимих (по вказаних правилах) результатів (багатоваріантна обробка); на подальших етапах зайві і неправильні варіанти відкидаються (метод фільтрів).

  Морфологічні і багато синтаксичних проблем М. п. в рамках ізольованої пропозиції в основному вирішено. Головні труднощі при створенні повністю автоматизованих систем високоякісного переведення пов'язані з недостатнім рівнем розробленості семантичної теорії мов, за допомогою якої можна було б точно сформулювати правила обробки сенсу і значень пропозицій мови.

  На практиці використовуються спрощені і спеціалізовані системи М. п., пов'язані з автоматизацією обробки науково-технічної інформації (послівне переведення з частковою граматичною обробкою і автоматичне реферування — для цілей експреса-інформації і патентної документації, а також для інформаційно-пошукових систем).

  Є видання, цілком або частково присвячені М. п., наприклад: журнали «Mechanical Translation» (Camb., з 1954), «Т. A. Informations» (P., з 1965; у 1960—64 виходив під назвою «Traduction automatique»), «Communications of the Association for Computing machinery» (Phil., з 1958), «Науково-технічна інформація. Серія 2» (М., з 1961), збірки «Машинне переведення і прикладна лінгвістика» (М., з 1959), «Проблеми кібернетики» (М., з 1958) та інші.

 

  Літ.: Перевідна машина П. П. Троянського. Збірка матеріалів про перевідну машину для перекладу з однієї мови на інших, запропонованою П. П. Троянським в 1933 р., М., 1959; Машинне переведення. Збірка статей, переклад з англійського, М., 1957; Панів Д. Ю., Автоматичне переведення, М., 1958; Ревзін І. І., Розенцвейг Ст Ю., Основи загального і машинного переведення, М., 1964; Мельчук І. А., Равіч Р. Д., Автоматичне переведення. 1949—1963. Крітіко-бібліографічній довідник, М., 1967; Автоматичне переведення. Збірка статей, переклад з англійського, італійського, німецького, французького, М., 1971.

  І. А. Мельчук, С. Я. Фітіалов