Статистична лінгвістика
 
а б в г д е ж з и й к л м н о п р с т у ф х ц ч ш щ ъ ы ь э ю я
 

Статистична лінгвістика

Статистична лінгвістика, дисципліна, що вивчає кількісні закономірності природної мови, що виявляються в текстах. У основі С. л. лежить припущення, що деякі чисельні характеристики і функціональні залежності між ними, отримані для обмеженої сукупності текстів, характеризують мову в цілому або його функціональні стилі (публіцистичний, науковий, художній і т.п.). Практично важливою і найбільш вивченою числовою характеристикою є відносна частота вжитку різних лінгвістичних одиниць (букв, фонем, складів, слів, синтаксичних конструкцій), їх класів (наприклад, голосних, приголосних, частин мови) і поєднань (наприклад, послідовностей з n букв). Дані про частоту слів (інколи словосполук) відбиваються в частотних словниках . Важливу роль в С. л. грає функціональна залежність зв'язок, що приблизно описує, між частотою слова і його номером (рангом) в послідовності по убуванню частот — Ципфа — Мандельброта закон. С. л. вивчає також залежності між частотою і довжиною слова (у числі складів), числом його значень і віком. Накопичені дані використовуються для виявлення особливостей стилю окремих авторів, атрибуції текстів, дешифровки історичних пісьменностей, для вирішення завдань стенографії, теорії зв'язку, а також інформатики . С. л. при здобутті чисельних характеристик використовує методи математичної статистики і деякі методи теорії інформації (для визначення ентропії і надмірності мови, див.(дивися) Інформації теорія ), а для встановлення зв'язку між спостережуваними характеристиками і вибору найбільш істотних з них — метод математичних моделей, що базуються на поняттях теорії вірогідності (див. Вірогідності теорія ) і математичної лінгвістики . Можливе ширше розуміння С. л. як використання методів статистики для перевірки лінгвістичних гіпотез, які можуть носити і якісний характер.

  Літ.: Головін Би. Н., Мова і статистика, М., 1971; Фрумкина Р. М., Статистичні методи і стратегія лінгвістичного дослідження, «Ізв. АН(Академія наук) СРСР. Серія літератури і мови». 1975, т. 34 №2; Штейнфельдт Е. А., Частотний словник сучасної російської мови, Талін, 1963; Herdan G., The advanced theory of language as choice and chance, B.,1966; Mulier Ch., Initiation а la statistique linguistique, P., 1968.

  М. Ст Арапів.