- Типи ступенів свободи
- У механічному корпусі
- У наборі випадкових значень
- Приклади
- Різноманітність і ступінь свободи
- У розподілі квадрата Chi
- У тесті гіпотез (З розв’язаним прикладом)
- Список літератури
В ступеня свободи в статистиці є числом незалежних компонент випадкового вектора. Якщо вектор має n компонентів і є p лінійні рівняння, що відносяться до його компонентів, то ступінь свободи np.
Поняття ступенів свободи з'являється і в теоретичній механіці, де вони приблизно еквівалентні розміру простору, де рухається частинка, за вирахуванням кількості зв’язків.
Малюнок 1. Маятник рухається у двох вимірах, але він має лише один ступінь свободи, оскільки він змушений рухатися по дузі радіусом L. Джерело: Ф. Сапата.
У цій статті буде обговорено поняття ступенів свободи, застосоване до статистики, але механічний приклад простіше уявити в геометричній формі.
Типи ступенів свободи
Залежно від контексту, в якому він застосовується, спосіб обчислення кількості ступенів свободи може відрізнятися, але основна ідея завжди однакова: загальні розміри за меншою кількістю обмежень.
У механічному корпусі
Розглянемо коливальну частинку, прив’язану до струни (маятника), яка рухається у вертикальній площині xy (2 виміри). Однак частинка змушена рухатися по окружності радіуса, рівній довжині хорди.
Оскільки частинка може рухатися тільки по цій кривій, кількість ступенів свободи дорівнює 1. Це можна побачити на рисунку 1.
Спосіб обчислення кількості ступенів свободи - це взяття різниці кількості розмірів за мінусом кількості обмежень:
ступенів свободи: = 2 (розміри) - 1 (лігатура) = 1
Ще одне пояснення, яке дозволяє нам досягти результату, таке:
-Ми знаємо, що положення в двох вимірах представлено точкою координат (x, y).
-Але оскільки точка повинна відповідати рівнянню окружності (x 2 + y 2 = L 2 ) для заданого значення змінної x, змінна y визначається згаданим рівнянням або обмеженням.
Таким чином, лише одна зі змінних є незалежною, а система має один (1) ступінь свободи.
У наборі випадкових значень
Для ілюстрації того, що означає поняття, припустимо вектор
x = (x 1 , x 2 ,…, x n )
Представлення вибірки з n нормально розподілених випадкових значень. У цьому випадку випадковий вектор x має n незалежних компонентів, і тому, як кажуть, x має n ступенів свободи.
Побудуємо тепер вектор r залишків
r = (x 1 -
Де
Отже сума
(х 1 -
Це рівняння, яке являє собою обмеження (або зв'язування) в елементах вектора r залишків, оскільки якщо n-1 компоненти вектора r відомі , рівняння обмеження визначає невідомий компонент.
Тому вектор r розмірності n з обмеженням:
∑ (x i -
Він має (n - 1) ступені свободи.
Знову застосовано, що обчислення кількості ступенів свободи:
ступенів свободи: = n (розміри) - 1 (обмеження) = n-1
Приклади
Різноманітність і ступінь свободи
Дисперсія s 2 визначається як середнє значення квадрата відхилень (або залишків) вибірки з n даних:
s 2 = ( r • r ) / (n-1)
де r - вектор залишків r = (x1 -
s 2 = ∑ (x i -
У будь-якому випадку слід зазначити, що при обчисленні середнього квадрату залишків воно ділиться на (n-1), а не на n, оскільки, як обговорювалося в попередньому розділі, кількість ступенів свободи вектора r становить ( п-1).
Якби для обчислення дисперсії його розділили на n замість (n-1), результат мав би зміщення, яке є дуже значущим для значень n менше 50.
У літературі формула дисперсії також з'являється з дільником n замість (n-1), коли мова йде про дисперсію сукупності.
Але множина випадкової величини залишків, представлена вектором r , хоча вона має розмірність n, має лише (n-1) ступені свободи. Однак якщо кількість даних досить велика (n> 500), обидві формули сходяться до одного результату.
Калькулятори та електронні таблиці надають як варіанти дисперсії, так і стандартне відхилення (яке є квадратним коренем дисперсії).
Наша рекомендація, зважаючи на аналіз, представлений тут, полягає у тому, щоб завжди обирати версію з (n-1) кожного разу, коли потрібно обчислити дисперсію або стандартне відхилення, щоб уникнути упереджених результатів.
У розподілі квадрата Chi
Деякі розподіли ймовірностей у безперервній випадковій величині залежать від параметра, який називається ступенем свободи, це стосується розподілу квадрата Chi (χ 2 ).
Назва цього параметра походить саме від ступенів свободи основного випадкового вектора, до якого застосовується цей розподіл.
Припустимо, у нас є g популяції, з яких беруть зразки розміру n:
X 1 = (x1 1 , x1 2 ,… ..x1 n )
X2 = (x2 1 , x2 2 ,… ..x2 n )
….
X j = (xj 1 , xj 2 ,… ..xj n )
….
Xg = (xg 1 , xg 2 ,… ..xg n )
Населення j, яке має середнє значення
Стандартизована або нормалізована змінна zj i визначається як:
zj i = (xj i -
А вектор Zj визначається так:
Zj = ( zj 1 , zj 2 ,…, zj i ,…, zj n ) і слідує стандартизованому нормальному розподілу N (0,1).
Отже змінна:
Q = ((z1 1 ^ 2 + z2 1 ^ 2 +…. + Zg 1 ^ 2),…., (Z1 n ^ 2 + z2 n ^ 2 +…. + Zg n ^ 2))
випливає розподіл χ 2 (g), який називається розподілом chi-квадрата зі ступенем свободи g.
У тесті гіпотез (З розв’язаним прикладом)
Коли ви хочете перевірити гіпотези на основі певного набору випадкових даних, вам потрібно знати кількість ступенів свободи g, щоб застосувати тест Chi-квадрата.
Малюнок 2. Чи існує взаємозв'язок між перевагою морозива FLAVOR та статтю клієнта? Джерело: Ф. Сапата.
Як приклад, будуть аналізуватися дані, зібрані щодо переваг шоколадного чи полуничного морозива серед чоловіків та жінок у певній салоні з морозивом. Частота, з якою чоловіки та жінки вибирають полуницю чи шоколад, узагальнена на рисунку 2.
Спочатку обчислюється таблиця очікуваних частот, яка готується шляхом множення загальної кількості рядків на загальну кількість стовпців, поділену на загальні дані. Результат показаний на наступному малюнку:
Малюнок 3. Розрахунок очікуваних частот на основі спостережуваних частот (значення синього кольору на рисунку 2). Джерело: Ф. Сапата.
Тоді квадрат Чи розраховується (за даними) за такою формулою:
χ 2 = ∑ (F o - F e ) 2 / F e
Де F o - спостережувані частоти (рис. 2) і F e - очікувані частоти (рис. 3). Підсумок проходить через усі рядки та стовпці, які в нашому прикладі дають чотири терміни.
Після виконання операцій ви отримуєте:
χ 2 = 0,2043.
Тепер необхідно порівняти з теоретичним квадратом Chi, який залежить від кількості ступенів свободи g.
У нашому випадку це число визначається так:
g = (# рядки - 1) (# колонки - 1) = (2 - 1) (2 - 1) = 1 * 1 = 1.
Виявляється, кількість ступенів свободи g у цьому прикладі дорівнює 1.
Якщо ви хочете перевірити або відхилити нульову гіпотезу (H0: немає зв’язку між TASTE та GENDER) зі рівнем значущості 1%, теоретичне значення Chi-квадрата обчислюється зі ступенем свободи g = 1.
Шукається значення, яке становить накопичену частоту (1 - 0,01) = 0,99, тобто 99%. Це значення (яке можна отримати з таблиць) становить 6 636.
Оскільки теоретичний Chi перевищує обчислений, то нульова гіпотеза перевірена.
Іншими словами, зі зібраними даними не спостерігається взаємозв'язку між змінними TASTE та GENDER.
Список літератури
- Мінітаб. Які ступеня свободи? Відновлено з: support.minitab.com.
- Мур, Девід. (2009) Основна прикладна статистика. Редактор Антоні Бош.
- Лі, Дженніфер. Як обчислити ступеня свободи в статистичних моделях. Відновлено: geniolandia.com
- Вікіпедія. Ступінь свободи (статистика). Відновлено з: es.wikipedia.com
- Вікіпедія. Ступінь свободи (фізична). Відновлено з: es.wikipedia.com