- Формули та рівняння
- Як обчислити помилку вибірки
- Для рівня впевненості
- Приклади
- - Приклад 1
- Рішення
- - Приклад 2
- Рішення
- - Приклад 3
- Рішення
- - Приклад 4
- Рішення
- - Вправа 5
- Рішення
- Список літератури
Вибірки помилка або вибірка помилка в статистиці являє собою різницю між середнім значенням зразка і середнього значенням загальної чисельності населення. Щоб проілюструвати ідею, давайте уявимо, що загальна чисельність населення міста становить один мільйон людей, з яких ви хочете, щоб його середній розмір взуття, для якого береться випадкова вибірка в тисячу людей.
Середній розмір, що випливає з вибірки, не обов'язково збігається з розміром всього населення, хоча якщо вибірка не є упередженою, значення має бути близьким. Ця різниця між середнім значенням вибірки та загальною сукупністю є помилкою вибірки.
Малюнок 1. Оскільки вибірка є підмножиною загальної сукупності, середня вибірка має похибку. Джерело: Ф. Сапата.
Середнє значення загальної сукупності, як правило, невідоме, однак існують методи зменшення цієї помилки та формули для оцінки межі помилки вибірки, про яку мова піде в цій статті.
Формули та рівняння
Скажімо, ми хочемо знати середнє значення певної вимірюваної характеристики x у популяції розміром N, але оскільки N є великою кількістю, неможливо здійснити дослідження на загальну чисельність населення, то перейдемо до вибіркової вибірки розмір n <
Середнє значення вибірки позначається через
Припустимо, m проби беруть із загальної сукупності N, всі мають однаковий розмір n із середніми значеннями
Ці середні значення не будуть ідентичними один одному і всі будуть приблизно середнім значенням сукупності μ. Межа помилки вибірки E вказує на очікуване розділення середніх значень
Стандартна межа похибки ε вибірки розміру n дорівнює:
ε = σ / √n
де σ - стандартне відхилення (квадратний корінь дисперсії), яке обчислюється за такою формулою:
σ = √
Значення стандартної межі похибки ε таке:
Середнє значення
Як обчислити помилку вибірки
У попередньому розділі була подана формула для знаходження стандартної межі помилки вибірки розміру n, де слово стандарт вказує на те, що це похибка з достовірністю 68%.
Це вказує на те, що якщо було взято багато зразків одного розміру n, 68% з них дадуть середні значення
Існує просте правило, яке називається правилом 68-95-99.7, яке дозволяє легко знаходити межу помилки вибірки для рівнів довіри 68%, 95% і 99,7%, оскільки цей запас 1⋅ ε, 2 ⋅ ε і 3⋅ ε відповідно.
Для рівня впевненості
Якщо рівень достовірності γ не є одним із наведених, то помилка вибірки - це стандартне відхилення σ, помножене на коефіцієнт Zγ, що отримується за наступною процедурою:
1.- Спочатку визначається рівень значущості α, який обчислюється від рівня довіри γ через наступне співвідношення: α = 1 - γ
2.- Тоді ми повинні обчислити значення 1 - α / 2 = (1 + γ) / 2, яке відповідає накопиченій нормальній частоті між -∞ та Zγ, у нормальному або гауссовому розподілі, типізованому F (z), визначення якого видно на малюнку 2.
3.- Рівняння F (Zγ) = 1 - α / 2 розв’язується за допомогою таблиць нормального (кумулятивного) розподілу F, або за допомогою комп'ютерного додатку, який має обернену стандартизовану функцію Гаусса F -1 .
В останньому випадку ми маємо:
Zγ = G -1 (1 - α / 2).
4.- Нарешті, ця формула застосовується для помилки вибірки з рівнем надійності γ:
E = Zγ ⋅ (σ / √n)
Малюнок 2. Таблиця нормального розподілу. Джерело: Wikimedia Commons.
Приклади
- Приклад 1
Обчисліть середню вагу помилки в середній масі зразка 100 новонароджених. Розрахунок середньої ваги був
Рішення
Стандартна похибка - ε = σ / √n = (1500 кг) / √100 = 0,15 кг. Це означає, що з цих даних можна зробити висновок, що вага 68% новонароджених становить від 2950 кг до 3,25 кг.
- Приклад 2
Визначте граничну похибку вибірки Е та ваговий діапазон 100 новонароджених із рівнем довіри 95%, якщо середня вага 3100 кг при стандартному відхиленні σ = 1500 кг.
Рішення
Якщо застосовується правило 68; 95; 99,7 → 1⋅ ε; 2⋅ ε; 3⋅ ε, маємо:
E = 2⋅ε = 2⋅0,15 кг = 0,30 кг
Іншими словами, 95% новонароджених матимуть вагу від 2800 до 3400 кг.
- Приклад 3
Визначте діапазон ваг новонароджених у Прикладі 1 з довірчою долею 99,7%.
Рішення
Похибка вибірки з достовірністю 99,7% становить 3 σ / √n, що для нашого прикладу E = 3 * 0,15 кг = 0,45 кг. Звідси випливає, що 99,7% новонароджених матимуть вагу від 2650 до 3,550 кг.
- Приклад 4
Визначте коефіцієнт Zγ для рівня довіри 75%. Визначте границю помилки вибірки з цим рівнем надійності для випадку, представленого в Прикладі 1.
Рішення
Рівень довіри γ = 75% = 0,75, що пов'язано з рівнем значущості α через співвідношення γ = (1 - α), так що рівень значущості становить α = 1 - 0,75 = 0 , 25.
Це означає, що сумарна нормальна ймовірність між -∞ і Zγ становить:
P (Z ≤ Zγ) = 1 - 0,125 = 0,875
Що відповідає значенню Zγ 1,1503, як показано на малюнку 3.
Малюнок 3. Визначення коефіцієнта Zγ, що відповідає рівню довіри 75%. Джерело: Ф. Сапата через Геогебру.
Іншими словами, помилка вибірки - E = Zγ ⋅ (σ / √n) = 1,15 ⋅ (σ / √n).
Застосовуючи дані з прикладу 1, вона дає помилку:
Е = 1,15 * 0,15 кг = 0,17 кг
З рівнем довіри 75%.
- Вправа 5
Який рівень довіри, якщо Z α / 2 = 2,4?
Рішення
P (Z ≤ Z α / 2 ) = 1 - α / 2
P (Z ≤ 2,4) = 1 - α / 2 = 0,9918 → α / 2 = 1 - 0,9918 = 0,0082 → α = 0,0164
Рівень значущості:
α = 0,0164 = 1,64%
І нарешті, рівень довіри залишається:
1- α = 1 - 0,0164 = 100% - 1,64% = 98,36%
Список літератури
- Canavos, G. 1988. Імовірність та статистика: Застосування та методи. McGraw Hill.
- Devore, J. 2012. Імовірність та статистика для інженерії та науки. 8-й. Видання. Візьміть на себе.
- Левін, Р. 1988. Статистика для адміністраторів. 2-й. Видання. Prentice Hall.
- Sudman, S. 1982. Задаючи питання: Практичний посібник з оформлення анкети. Сан Франциско. Джоссі Басс.
- Walpole, R. 2007. Вірогідність та статистика для інженерії та наук. Пірсон.
- Wonnacott, TH та RJ Wonnacott. 1990. Вступна статистика. 5-й ред. Вілі
- Вікіпедія. Помилка вибірки. Відновлено з: en.wikipedia.com
- Вікіпедія. Похибка. Відновлено з: en.wikipedia.com