Статистична перевірка гіпотез
 
а б в г д е ж з и й к л м н о п р с т у ф х ц ч ш щ ъ ы ь э ю я
 

Статистична перевірка гіпотез

Статистична перевірка гіпотез, система прийомів в математичній статистиці, призначених для перевірки відповідності дослідних даних деякій статистичній гіпотезі . Процедури С. п. р. дозволяють приймати або відкидати статистичні гіпотези, що виникають при обробці або інтерпретації результатів вимірів в багатьох практично важливих розділах науки і виробництва, пов'язаних з експериментом. Правило, по якому приймається або відхиляється дана гіпотеза, називається статистичним критерієм. Побудова критерію визначається вибором відповідної функції Т від результатів спостережень, яка служить мірою розбіжності між дослідними і гіпотетичними значеннями. Ця функція, що є випадковою величиною, називається статистикою критерію, при цьому передбачається, що розподіл вірогідності Т може бути обчислене при допущенні, що гіпотеза, що перевіряється, вірна. По розподілу статистики Т знаходиться значення Т 0 , таке, що якщо гіпотеза вірна, то вірогідність нерівності T > T 0 рівна а, де а — заздалегідь заданий значущості рівень . Якщо в конкретному випадку виявиться що Т > T 0 , то гіпотеза відкидається, тоді як поява значення Т £ T 0 не протіворечит гіпотезі. Хай, наприклад, потрібно перевірити гіпотезу про те, що незалежні результати спостережень x 1 ..., x n підкоряються нормальному розподілу з середнім значенням а = a 0 і відомою дисперсією s 2 . При цьому припущенні середнє арифметичне результатів спостережень розподілено нормально з середнім а = a 0 і дисперсією s 2 /n , а величина  розподілена нормально з параметрами (0, 1). Вважаючи   можна знайти зв'язок між T 0 і а по таблицях нормального розподілу. Наприклад, при гіпотезі а = a 0 подія Т > 1, 96 має вірогідність а = 0,05. Правило, що рекомендує вважати, що гіпотеза а = a 0 невірна, якщо Т > 1,96, приводитиме до помилкового відкидання цієї гіпотези в середньому в 5 випадках з 100, в яких вона вірна. Якщо ж Т £ 1,96, то це ще не означає, що гіпотеза підтверджується, т.к. указанноє нерівність з великою вірогідністю може виконуватися при а , близьких до a 0 . Отже, при використанні запропонованого критерію можна лише стверджувати, що результати спостережень не протіворечат гіпотезі а = a 0 . При виборі статистики Т завжди явно або неявно враховують гіпотези, що конкурують з гіпотезою а = a 0 . Наприклад, якщо заздалегідь відомо, що а ³ a 0 , тобто відхилення гіпотези а = a 0 вабить прийняття гіпотези а > a 0 , то замість Т слід узяти . Якщо дисперсія s 2 невідома, то замість даного критерію для перевірки гіпотези а = a 0 можна скористатися т.з. критерієм Стьюдента, заснованим на статистиці  яка включає незміщену оцінку дисперсії

 

  і підпорядкована Стьюдента розподілу з n — 1 мірами свободи (подібне завдання див.(дивися) в ст. Математична статистика, таблиця. 1a). Такого роду критерії називаються критеріями згоди і використовуються як для перевірки гіпотез про параметри розподілу, так і гіпотез про самі розподіли (див. Непараметричні методи ). При рішенні питання про прийнятті або відхиленні якої-небудь гіпотези H 0 за допомогою будь-якого критерію, що грунтується на результатах спостереження, можуть бути допущені помилки двох типів. Помилка «першого роду» здійснюється тоді, коли відкидається вірна гіпотеза H 0 . Помилка «другого роду» здійснюється у тому випадку, коли гіпотеза H 0 приймається, а насправді вірна не вона, а яка-небудь альтернативна гіпотеза Н . Природно вимагати, щоб критерій для перевірки даної гіпотези приводив можливо рідше до помилкових рішень. Звичайна процедура побудови найкращого критерію для простий гіпотези полягає у виборі серед всіх критеріїв із заданим рівнем значущості і (вірогідність помилки першого роду) такого, який приводив би до найменшої вірогідності помилки другого роду (або, що те ж саме, до найбільшої вірогідності відхилення гіпотези, коли вона невірна). Остання вірогідність (доповнююча до одиниці вірогідність помилки другого роду) називається потужністю критерію. У разі, коли альтернативна гіпотеза Н проста, найкращим буде критерій, який має найбільшу потужність серед всіх інших критеріїв із заданим рівнем значущості а (найбільш потужний критерій). Якщо альтернативна гіпотеза Н складна, наприклад залежить від параметра, то потужність критерію буде функцією, визначеною на класі простих альтернатив, складових Н , тобто буде функцией параметра. Критерій, що має найбільшу потужність при кожній альтернативній гіпотезі з класу Н , називається рівномірно найбільш потужним, проте слід зазначити, що такий критерій існує лише в небагатьох спеціальних ситуаціях. У завданні перевірки гіпотези про середнє значення нормальної сукупності а = а 0 проти альтернативної гіпотези а > a 0 рівномірно найбільш потужний крітерій існує, тоді як при перевірці тій же гіпотези проти альтернативи а ¹ a 0 його немає. Тому часто обмежуються пошуком рівномірно найбільш потужних критеріїв в тих або інших спеціальних класах (Інваріантних, незміщених критеріїв і т.п.).

  Теорія С. п. р. дозволяє з єдиної крапки зір трактувати різні завдання математичної, що висуваються практикою статистики (оцінка відмінності між середніми значеннями, перевірка гіпотези постійності дисперсії, перевірка гіпотези незалежності, перевірка гіпотез про розподіли і т.п. Ідеї послідовного аналізу, застосовані до С. п. р., вказують на можливість зв'язати рішення про прийняття або відхилення гіпотези з результатами последовательно спостережень, що проводяться (в цьому випадку число спостережень на основі яких за певним правилом приймається рішення, не фіксується заздалегідь, а визначається в ході експерименту) (див. також Статистичні вирішення ).

  Літ.: Kpamep Р., Математичні методи статистики, пер.(переведення) з англ.(англійський), 2 видавництва, М., 1975; Леман Е., Перевірка статистичних гіпотез, пер.(переведення) з англ.(англійський), М., 1964.

  Л. Ст Прохоров.