Статистичний аналіз багатовимірний
 
а б в г д е ж з и й к л м н о п р с т у ф х ц ч ш щ ъ ы ь э ю я
 

Статистичний аналіз багатовимірний

Статистичний аналіз багатовимірний, в широкому сенсі — розділ математичної статистики, об'єднуючий методи вивчення статистичних даних, що відносяться до об'єктів, які характеризуються декількома якісними або кількісними ознаками. Найбільш розроблена частина С. а. м., заснована на допущенні, що результати окремих спостережень незалежні і підпорядковані одному і тому ж багатовимірному нормальному розподілу (зазвичай саме до цієї частини застосовують термін С. а. м. у вузькому сенсі). Іншими словами, результат X j   спостереження з номером j можна представити вектором

X j = ( X j1 , X j2 ..., X js ),

де випадкові величини X jk мають математичне чекання m до , дисперсію s 2 до , а коефіцієнт кореляції між X jk і X jl рівний r kl . Вектор математичних чекань m = (m 1 ..., m s ) і коваріационная матриця S з елементами s до s l r kl , до, l = 1..., s , є основними параметрами, що повністю визначають розподіл векторів X 1 ..., X n — результатів п незалежних спостережень. Вибір багатовимірного нормального розподілу як основна математична модель С. а. м. частково може бути виправданий наступними міркуваннями: з одного боку, ця модель прийнятна для великого числа додатків, з іншої — лише в рамках цієї моделі удається обчислити точні розподіли вибіркових характеристик. Вибіркове середнє  і вибіркова коваріационная матриця

 

  [де  позначає транспонований вектор, див.(дивися) Матриця ] суть оцінки максимальної правдоподібності відповідних параметрів сукупності. Розподіл  нормальний, а спільний розподіл елементів коваріационной матриці S , т.з. розподіл Уїшарта, є природним узагальненням «хі-квадрат» розподіли і грає значну роль в С. а. м.

  Ряд завдань С. а. м. більш менш аналогічний відповідним одновимірним завданням (наприклад, завдання перевірки гіпотез про рівність середніх значень в двох незалежних вибірках). Іншого типа завдання пов'язані з перевіркою гіпотез про незалежність тих або інших груп компонент векторів X j , перевіркою таких спеціальних гіпотез, як гіпотеза сферичній симетрії розподілу X j і т.д. Необхідність розібратися в складних взаємозв'язках між компонентамі випадкових векторів X j ставить нові проблеми. В цілях скорочення числа даних випадкових ознак (зменшення розмірності) або зведення їх до незалежних випадкових величин застосовуються метод головних компонент і метод канонічних кореляцій. У теорії головних компонент здійснюється перехід від векторів Xj до векторів Y j = ( Y j1 ..., Y jr ). При цьому, наприклад, Y j1 виділяється максимальною дисперсією серед всіх нормованих лінійних комбінацій компонент X 1 ; Y j2 має найбільшу дисперсію серед всіх лінійних функцій компонент X 1 , що не корелюються з Y j1 і т.д. У теорії канонічних кореляцій кожне з двох безлічі випадкових величин (компонент X j ) лінійно перетвориться в нову безліч т.з. канонічних величин так, що усередині кожної безлічі коефіцієнти кореляції між величинами дорівнюють 0, перші координати кожної безлічі мають максимальну кореляцію, другі координати мають найбільшу кореляцію з координат і , що залишилися;т.д. (впорядковані т.ч. кореляції називаються канонічними). Останній метод вказує максимальну кореляцію лінійних функцій від двох груп випадкових компонент вектора спостереження. Виводи методів головних компонент і канонічних кореляцій допомагають зрозуміти структуру багатовимірної сукупності, що вивчається. Схожим цілям служить і факторний аналіз, в схемі якого передбачається, що компоненти випадкових векторів X j явлются лінійними функціями від деяких спостережених чинників, що підлягають вивченню. В рамках С. а. м. розглядається і проблема диференціації два або більшого числа совокупностей за результатами спостережень. Одна частина проблеми полягає в тому, щоб на основі аналізу вибірок з декількох совокупностей віднести новий елемент до однієї з них (дискримінація), інша — в тому, щоб усередині сукупності розділити елементи на групи, в певному значенні що максимально відрізняються один від одного.

  Літ.: Андерсон Т., Введення, в багатовимірний статистичний аналіз пер.(переведення) з англ.(англійський), М., 1963; Kendall М. G., Stuart А., The advanced theory of statistics, v. 3, L., 1966; Dempster A. P., Elements of continuons multivariate analysis, L., 1969.

  А. Ст Прохоров.