Тест Тукі - це метод, спрямований на порівняння окремих засобів з дисперсійного аналізу декількох зразків, підданих різним методам лікування.
Тест, представлений у 1949 р. John.W. Tukey, дозволяє нам визначити, чи отримані результати значно відрізняються чи ні. Він також відомий як Тьюкі чесно значущою різницевою пробою (тест на Тукі на HSD).
Малюнок 1. Тест Тукі дозволяє нам встановити, чи мають різниці в результатах між трьома або більше різними методами лікування, застосованими до трьох або більше груп з однаковими характеристиками, суттєво і чесно різні значення середнього значення.
В експериментах, де порівнюється три чи більше різних методів лікування, застосовуваних до однієї і тієї ж кількості зразків, слід визначити, чи є результати суттєво різними чи ні.
Кажуть, що експеримент є збалансованим, коли розмір усіх статистичних зразків однаковий для кожної обробки. Коли розмір зразків відрізняється для кожної обробки, тоді проводиться незбалансований експеримент.
Іноді за допомогою аналізу дисперсії (ANOVA) іноді недостатньо знати, чи в порівнянні різних методів лікування (або експериментів), застосованих до декількох зразків, вони виконують нульову гіпотезу (Хо: "всі методи лікування рівні") або, навпаки, виконує альтернативну гіпотезу (Ha: "принаймні одна з процедур різна").
Тест Тукі не унікальний, існує ще багато тестів для порівняння зразкових засобів, але це один з найбільш відомих і застосовуваних.
Турки порівняння та стіл
При застосуванні цього тесту обчислюється значення w, яке називається порівнянням Tukey, визначення якого таке:
w = q √ (MSE / r)
Де фактор q отриманий з таблиці (таблиця Тукі), яка складається з рядків значень q для різної кількості обробок або експериментів. У стовпцях вказується значення фактора q для різних ступенів свободи. Зазвичай наявні таблиці мають відносне значення 0,05 і 0,01.
У цій формулі в квадратному корені з'являється коефіцієнт MSE (Середня площа помилки), розділений на r, що вказує на кількість повторень. MSE - це число, яке зазвичай отримують з аналізу дисперсій (ANOVA).
Коли різниця між двома середніми значеннями перевищує значення w (порівняння Tukey), то робиться висновок, що вони різні середні, але якщо різниця менша за число Tukey, то це два зразки зі статистично однаковим середнім значенням .
Число w також відоме як число HSD (Чесно кажучи істотна різниця).
Це єдине порівняльне число можна застосувати, якщо кількість проб, поданих для тесту кожної обробки, однакова у кожній з них.
Неврівноважені експерименти
Якщо з якихось причин розмір зразків відрізняється в кожній обробці для порівняння, то описана вище процедура дещо відрізняється і відома як тест Тукі-Крамера.
Тепер отримане порівняльне число w для кожної пари процедур i, j:
w (i, j) = q √ (½ MSE / (ri + rj))
У цій формулі фактор q отримується з таблиці Тукі. Цей фактор q залежить від кількості процедур і ступеня свободи помилки. r i - кількість повторень у лікуванні i, тоді як r j - кількість повторень у лікуванні j.
Приклад випадку
Кролик-заводчик хоче зробити надійне статистичне дослідження, яке говорить йому, яка з чотирьох марок кормів для відгодівлі кроликів є найбільш ефективною. Для дослідження він сформував чотири групи з шістьма півторамісячними кроликами, які до цього мали однакові умови годівлі.
Причини полягали в тому, що у групах А1 і А4 смерть сталася через причини, які не можна віднести до їжі, оскільки одного з кроликів вкусила комаха, а в іншому випадку смерть, ймовірно, була причиною вродженого дефекту. Тож групи є неврівноваженими, і тоді необхідно застосувати тест Тукі-Крамера.
Вправа вирішена
Щоб не подовжувати обчислення занадто довго, збалансований експериментальний випадок буде вважатися вирішеною вправою. Дані будуть взяті як дані:
У цьому випадку є чотири групи, що відповідають чотирьом різним методам лікування. Однак ми спостерігаємо, що всі групи мають однакову кількість даних, тож це виважений випадок.
Для проведення аналізу ANOVA був використаний інструмент, включений до електронної таблиці Libreoffice. Інші електронні таблиці, такі як Excel, містять цей інструмент для аналізу даних. Нижче наведена підсумкова таблиця, яка виникла після проведення аналізу дисперсії (ANOVA):
З аналізу дисперсії ми маємо також значення Р, яке для прикладу становить 2,24Е-6, що значно нижче рівня значущості 0,05, що безпосередньо призводить до відкидання нульової гіпотези: Усі методи лікування рівні.
Тобто серед методів лікування деякі мають різні середні значення, але необхідно знати, які статистично значущі та чесні відмінності (HSD) використовуються за допомогою тесту Tukey.
Щоб знайти число wo, як відоме також число HSD, нам потрібно знайти середній квадрат помилки MSE. З аналізу ANOVA виходить, що сума квадратів у межах груп дорівнює SS = 0,2; а кількість ступенів свободи в групах df = 16, з цими даними ми можемо знайти MSE:
MSE = SS / df = 0,2 / 16 = 0,0125
Також потрібно знайти коефіцієнт Tukey q, скориставшись таблицею. Стовпець 4, який відповідає 4 групам або методам лікування, які слід порівняти, і рядок 16 шукають, оскільки аналіз ANOVA дав 16 ступенів свободи в межах груп. Це призводить нас до значення q, рівного: q = 4,33, що відповідає 0,05 значущості або 95% надійності. Нарешті знайдено значення для "чесно значущої різниці":
w = HSD = q √ (MSE / r) = 4,33 √ (0,0125 / 5) = 0,2165
Щоб знати, які є чесно різні групи або методи лікування, ви повинні знати середні значення кожного лікування:
Необхідно також знати відмінності середніх значень парних процедур, що показано в наступній таблиці:
Зроблено висновок, що кращими методами лікування з точки зору максимізації результату є Т1 або Т3, які байдужі з статистичної точки зору. Щоб вибрати між T1 і T3, потрібно було б шукати інші фактори поза аналізом, представленим тут. Наприклад, ціна, наявність тощо.
Список літератури
- Кохран Вільям і Кокс Гертруда. 1974. Експериментальні розробки. Молоть. Мексика. Третя перевидання. 661р.
- Snedecor, GW і Cochran, WG 1980. Статистичні методи. Сьома редакція штату Айова, Університетська преса штату Айова. 507p.
- Steel, RGD and Torrie, JH 1980. Принципи та процедури статистики: біометричний підхід (2-е видання). McGraw-Hill, Нью-Йорк. 629р.
- Tukey, JW 1949. Порівняння окремих засобів при аналізі дисперсії. Біометрія, 5: 99-114.
- Вікіпедія. Тест Тукі. Відновлено з: en.wikipedia.com