Статистический анализ многомерный
 
а б в г д е ж з и й к л м н о п р с т у ф х ц ч ш щ ъ ы ь э ю я
 

Статистический анализ многомерный

Статистический анализ многомерный, в широком смысле — раздел математической статистики, объединяющий методы изучения статистических данных, относящихся к объектам, которые характеризуются несколькими качественными или количественными признаками. Наиболее разработана часть С. а. м., основанная на допущении, что результаты отдельных наблюдений независимы и подчинены одному и тому же многомерному нормальному распределению (обычно именно к этой части применяют термин С. а. м. в узком смысле). Иными словами, результат Xj  наблюдения с номером j можно представить вектором

Xj = (Xj1, Xj2,..., Xjs),

где случайные величины Xjk имеют математическое ожидание mk, дисперсию s2k, а коэффициент корреляции между Xjk и Xjl равен rkl. Вектор математических ожиданий m = (m1,..., ms) и ковариационная матрица S с элементами sk sl rkl, k, l = 1,..., s, являются основными параметрами, полностью определяющими распределение векторов X1,..., Xn — результатов п независимых наблюдений. Выбор многомерного нормального распределения в качестве основной математической модели С. а. м. отчасти может быть оправдан следующими соображениями: с одной стороны, эта модель приемлема для большого числа приложений, с другой — только в рамках этой модели удаётся вычислить точные распределения выборочных характеристик. Выборочное среднее  и выборочная ковариационная матрица

 

  [где  обозначает транспонированный вектор , см.(смотри) Матрица] суть оценки максимального правдоподобия соответствующих параметров совокупности. Распределение  нормально , а совместное распределение элементов ковариационной матрицы S, т. н. распределение Уишарта, является естественным обобщением «хи-квадрат» распределения и играет значительную роль в С. а. м.

  Ряд задач С. а. м. более или менее аналогичен соответствующим одномерным задачам (например, задача проверки гипотез о равенстве средних значений в двух независимых выборках). Другого типа задачи связаны с проверкой гипотез о независимости тех или иных групп компонент векторов Xj, проверкой таких специальных гипотез, как гипотеза сферической симметрии распределения Xj и т.д. Необходимость разобраться в сложных взаимосвязях между компонентами случайных векторов Xj ставит новые проблемы. В целях сокращения числа рассматриваемых случайных признаков (уменьшения размерности) или сведения их к независимым случайным величинам применяются метод главных компонент и метод канонических корреляций. В теории главных компонент осуществляется переход от векторов Xj к векторам Yj = (Yj1,..., Yjr). При этом, например, Yj1 выделяется максимальной дисперсией среди всех нормированных линейных комбинаций компонент X1; Yj2 имеет наибольшую дисперсию среди всех линейных функций компонент X1, не коррелированных с Yj1 и т.д. В теории канонических корреляций каждое из двух множеств случайных величин (компонент Xj) линейно преобразуется в новое множество т. н. канонических величин так, что внутри каждого множества коэффициенты корреляции между величинами равны 0, первые координаты каждого множества имеют максимальную корреляцию, вторые координаты имеют наибольшую корреляцию из оставшихся координат и т.д. (упорядоченные т. о. корреляции называются каноническими). Последний метод указывает максимальную корреляцию линейных функций от двух групп случайных компонент вектора наблюдения. Выводы методов главных компонент и канонических корреляций помогают понять структуру изучаемой многомерной совокупности. Сходным целям служит и факторный анализ, в схеме которого предполагается, что компоненты случайных векторов Xj явлются линейными функциями от некоторых ненаблюдаемых факторов, подлежащих изучению. В рамках С. а. м. рассматривается и проблема дифференциации двух или большего числа совокупностей по результатам наблюдений. Одна часть проблемы заключается в том, чтобы на основе анализа выборок из нескольких совокупностей отнести новый элемент к одной из них (дискриминация), другая — в том, чтобы внутри совокупности разделить элементы на группы, в определённом смысле максимально отличающиеся друг от друга.

  Лит.: Андерсон Т., Введение в многомерный статистический анализ, пер.(перевод) с англ.(английский), М., 1963; Kendall М. G., Stuart А., The advanced theory of statistics, v. 3, L., 1966; Dempster A. P., Elements of continuons multivariate analysis, L., 1969.

  А. В. Прохоров.