Індексування
 
а б в г д е ж з и й к л м н о п р с т у ф х ц ч ш щ ъ ы ь э ю я
 

Індексування

Індексування, процес вираження головного предмету або теми тексту якого-небудь документа в термінах інформаційно-пошукової мови . Застосовується для полегшення пошуку необхідного тексту серед безлічі інших. Проводиться І. як цілого документа, так і його частини. Для І. незрідка використовуються заголовки текстів. При І. опускаються супутні предмети або теми. Це служить причиною того, що при пошуку не знайденими залишаються тексти, для яких предмет або тема інформаційного запиту є не головним, а супутнім. Розрізняють 2 основних типа І. — класифікаційне і координатне. При класифікаційному І., або класифікації, тексти залежно від їх вмісту включаються у відповідний клас (один або декілька), в якому збираються всі тексти, що мають в основному однаковий смисловий вміст. Кожному такому тексту надається індекс цього класу, службовець далі його пошуковим чином. При координатному І. основний смисловий вміст тексту виражається переліком полнозначних слів, вибираних або з самого тексту або його заголовка, або із спеціального нормативного словника. У першому випадку такі лексичні одиниці називаються ключовими словами, а в другому — дескрипторами . Кожне ключове слово або дескриптор позначає клас, в який потенційно входять всі тексти, де у вирази основного смислового вмісту входить це слово. Логічний твір класів, які позначені всіма словами, що виражають в сукупності основний смисловий вміст тексту, як би утворює деякий складний клас. Побудований в такий спосіб складний клас позначається переліком ключових слів або дескрипторів, і цей перелік служить пошуковим образом даного тексту або вираженням на інформаційно-пошуковій мові смислового вмісту запиту. Таким чином, при координатному І. смисловий вміст тексту виражається як би вказівкою його координат в деякому n -мерном смисловому просторі. Різновидом координатного І. є пермутационноє, або циклічне, І., яке засноване на використанні ключових слів заголовка тексту і полягає в тому, що всі ключові слова заголовка разом з контекстом по черзі виводяться в пошукову колонку. У цій колонці ключові слова даються в алфавітному порядку. На основі координатного І. створені і складніші інформаційно-пошукові мови. Основна перевага координатного І. перед класифікаційним полягає в тому, що координатне І. не створює жодної скрути при пошуку текстів по будь-якому, заздалегідь не передбаченому поєднанню ознак. Особливим типом І. слід рахувати розкриття смислового вмісту тексту бібліографію, що приводиться разом з ним, — імена авторів і бібліографічні описи їх робіт, на які посилається автор даного тексту. Таке І. служить основою для складання покажчиків цитованої літератури — вельми ефективного інструменту не лише для пошуку документів, але і для вирішення інших завдань (науковедчеських, прогностичних і т. д.).

 

  Літ.: Міхайлов А. І., Чорний А. І., Гиляревський Р. С., Основи інформатики, 2 видавництва, М., 1968, с. 179—222, 244—515: Sharp J. R., Some fundamentals of information retrieval, L., 1965, р. 11—120, 156—203; Stevens М. E., Automatic indexing: а state-of-the-art report, Wash., 1965 (National Bureau of Standards, Monograph 91).

  А. І. Чорний.