Загальний питання при порівнянні двох наборів вимірювань полягає в тому, чи слід використовувати процедуру параметричного тестування або непараметрическую. Найчастіше, використовуючи симуляцію, порівнюють декілька параметричних і непараметричних тестів, таких як t-тест, нормальний тест (параметричні критерії), рівня Уілкоксона, оцінки Ван-дер-Вальдена і т. д.(непараметричні).
Параметричні тести припускають базові статистичні розподілу даних. Тому необхідно виконати кілька умов дійсності, щоб їх результат був надійним. Непараметричні тести не залежать від будь-якого розподілу. Таким чином, вони можуть застосовуватися, навіть якщо параметричні умови дійсності не виконуються. У даній статті ми розглянемо параметричний метод, а саме – коефіцієнт кореляції Стьюдента.
Параметричний метод порівняння вибірок (t-Ст’юдента)
Методи класифікуються на основі того, що ми знаємо про суб’єктів, яких ми аналізуємо. Основна ідея полягає в тому, що існує набір фіксованих параметрів, які визначають імовірнісну модель. Всі види коефіцієнта Стьюдента – це параметричні методи.
Ними часто є ті методи, при аналізі яких ми бачимо, що суб’єкт є приблизно нормальним, тому перед тим, як використовувати критерій, слід здійснити перевірку на нормальність. Тобто розміщення ознак в таблиці розподілу Стьюдента (в обох вибірках) не повинне істотно відрізнятися від нормального і зобов’язана відповідати або приблизно узгоджуватися з указаним параметром. Для нормального розподілу існує два показники: середнє і стандартне відхилення.
Застосування t-критерію стьюдента проводиться при перевірці гіпотез. Він дозволяє перевірити припущення, застосовне до випробуваним. Найчастіше цей критерій застосовується для того, щоб перевірити, чи рівні середні значення двох вибірках, але також може застосовуватися і для одного.
Слід додати, що перевага використання параметричного тесту замість непараметричного полягає в тому, що перше буде мати більшу статистичну потужність, ніж останнім. Іншими словами, параметричний тест здатний привести до відмови від нульової гіпотези.
Критерії t-Стьюдента для однієї вибірки
Застосування для однієї вибірки коефіцієнта Стьюдента – це статистична процедура, що використовується для визначення того, чи може зразок спостережень бути створений процесом зі спеціальним середнім значенням. Припустимо, середнє значення розглянутого ознаки Мх відмінно від певного відомого значення A. Це означає, що ми можемо висунути гіпотези H0 і H1. C допомогою формули t-емпіричного для однієї вибірки ми можемо перевірити яка з цих допущених нами гіпотез вірна.
Формула емпіричного значення критерію t-Стьюдента:
Критерії t-Стьюдента для незалежних вибірок
Незалежний коефіцієнт Стьюдента – це використання його, коли виходять два окремих набори незалежних і однаково розподілених вибірок, по одному від кожного з двох порівнюваних зіставлень. При незалежному допущення передбачається, що члени двох вибірок не складуть пари корелюють значень ознаки. Наприклад, припустимо, що ми оцінюємо ефект медичного лікування і зараховуємо 100 пацієнтів у наше дослідження, потім довільно призначаємо 50 пацієнтів у групи лікування і 50 – у контрольну. В цьому випадку ми маємо два незалежних зразка, відповідно, можемо оформити статистичні гіпотези H0 і H1 і перевірити їх за допомогою даних формул.
Формули для емпіричного значення критерію t-Стьюдента:
Формула-1 може застосовуватися для приблизних розрахунків, для близьких за кількістю вибірок, а формула 2 — для чітких розрахунків, коли вибірки помітно відрізняються за кількістю.
Критерії t-Стьюдента для залежних вибірок
Парні t-тести зазвичай складаються з співпадаючих пар однакових одиниць або однієї групи одиниць, яка була двічі перевірена («повторне вимірювання» t-критерію). Коли ми маємо залежні вибірки або два ряди даних, позитивно корелюють один з одним, можемо, відповідно, оформити статистичні гіпотези H0 і H1 і перевірити їх за допомогою даної нам формули емпіричного значення критерію t-Стьюдента.
Наприклад, випробовувані піддаються тестуванню до лікування при високому кров’яному тиску і знову тестуються після лікування препаратом для його зниження. Порівнюючи ті ж самі показники пацієнтів до і після лікування, ми ефективно використовуємо кожного з них в якості свого власного контролю.
Таким чином, правильне відхилення нульової гіпотези може стати набагато більш імовірним, при цьому статистична сила збільшується просто тому, що випадкова варіація між пацієнтами тепер усунена. Зверніть увагу, однак, що збільшення статистичної потужності відбувається за оцінкою: потрібно більше тестів, кожен випробуваний повинен бути двічі перевірений.
Висновок
Форма тестування гіпотез, коефіцієнт Стьюдента – це лише один з багатьох варіантів, що використовуються для цієї мети. Статистики повинні додатково використовувати методи, відмінні від t-тесту, для вивчення більшої кількості змінних з великими розмірами вибірки.