- Розмір вибірки
- Випадок 1: чисельність населення невідома
- Рівні впевненості та відповідні їм значення Z
- Випадок 2: чисельність населення відома
- Приклади
- Опитування та анкетування
- QA
- Перевага
- Недоліки
- Вправа вирішена
- Рішення
- Список літератури
Випадкова вибірка в тому , як вибрати статистично репрезентативну вибірку з даної популяції. Частина принципу, що кожен елемент у вибірці повинен мати однакову ймовірність бути вибраним.
Малюнок - приклад випадкової вибірки, в якій кожному члену групи учасників присвоюється число. Для вибору номерів, що відповідають призам розіграшу (зразок), використовується деяка випадкова техніка, наприклад вилучення з поштової скриньки цифр, записаних на однакових картках.
Малюнок 1. При випадковому відборі вибірку відбирають з популяції випадковим чином за допомогою певної методики, яка гарантує, що всі елементи мають однакову ймовірність вибору. Джерело: netquest.com.
У випадковому відборі важливо правильно вибрати розмір вибірки, оскільки нерепрезентативна вибірка сукупності може призвести до помилкових висновків через статистичні коливання.
Розмір вибірки
Існують формули для визначення належного розміру вибірки. Найважливішим фактором, який слід врахувати, є те, чи відомий чисельність чисельності населення чи ні. Давайте розглянемо формули для визначення розміру вибірки:
Випадок 1: чисельність населення невідома
Коли розмір популяції N невідомий, можна вибрати зразок адекватного розміру n, щоб визначити, чи є певна гіпотеза правдивою чи помилковою.
Для цього використовується наступна формула:
Де:
-p - ймовірність того, що гіпотеза правдива.
-q - ймовірність того, що його немає, тому q = 1 - p.
-E - відносна похибка, наприклад, похибка 5% має маржу E = 0,05.
-З пов'язаний з рівнем впевненості, який вимагає дослідження.
У стандартизованому (або нормалізованому) нормальному розподілі рівень довіри 90% має Z = 1,645, оскільки ймовірність того, що результат знаходиться між -1 645σ та + 1645σ, становить 90%, де σ - стандартне відхилення .
Рівні впевненості та відповідні їм значення Z
1.- 50% рівня довіри відповідає Z = 0,675.
2.- 68,3% рівень довіри відповідає Z = 1.
3.- рівень довіри 90% еквівалентний Z = 1645.
4.- 95% рівня довіри відповідає Z = 1,96
5.- 95,5% рівня довіри відповідає Z = 2.
6.- 99,7% рівень довіри еквівалентний Z = 3.
Прикладом, коли цю формулу можна застосувати, було б у дослідженні для визначення середньої ваги гальки на пляжі.
Зрозуміло, що вивчити і зважити всі гальки на пляжі неможливо, тому доцільно витягувати зразок якомога випадковіше і з відповідною кількістю елементів.
Малюнок 2. Для вивчення характеристик камінчиків на пляжі необхідно вибрати випадкову вибірку з репрезентативною їх кількістю. (Джерело: pixabay)
Випадок 2: чисельність населення відома
Коли число N елементів, що складають певну сукупність (або Всесвіт), відоме, якщо ми хочемо обрати статистично значущу вибірку розміру n простим випадковим вибіркою, це формула:
Де:
-Z - коефіцієнт, пов'язаний з рівнем довіри.
-p - ймовірність успіху гіпотези.
-q - ймовірність провалу в гіпотезі, p + q = 1.
-N - це чисельність всього населення.
-E - відносна похибка результату дослідження.
Приклади
Методика вилучення зразків багато в чому залежить від типу дослідження, який потрібно провести. Тому випадковий вибірковий вибір має нескінченну кількість застосувань:
Опитування та анкетування
Наприклад, у телефонних опитуваннях людей, з якими проводиться консультація, вибирають за допомогою генератора випадкових чисел, застосовного до досліджуваного регіону.
Якщо ви хочете застосувати анкету до працівників великої компанії, тоді ви можете вдатися до вибору респондентів через їх номер працівника або номер посвідчення особи.
Зазначене число також слід вибирати випадковим чином, використовуючи, наприклад, генератор випадкових чисел.
Малюнок 3. Анкета може бути застосована шляхом випадкового вибору учасників. Джерело: Pixabay.
QA
У випадку, якщо дослідження проводиться на деталях, виготовлених машиною, деталі слід вибирати випадковим чином, але з партій, виготовлених у різний час доби, або в різні дні чи тижні.
Перевага
Простий випадковий вибірки:
- Це дозволяє знизити витрати на статистичне дослідження, оскільки не потрібно вивчати загальну сукупність для отримання статистично достовірних результатів з бажаними рівнями довіри та рівнем помилок, необхідним у дослідженні.
- Уникайте упередженості: оскільки вибір елементів, які слід вивчати, є абсолютно випадковим, дослідження достовірно відображає характеристики населення, хоча вивчалася лише його частина.
Недоліки
- Метод не є адекватним у випадках, коли ви хочете знати переваги у різних групах чи верствах населення.
У цьому випадку бажано попередньо визначити групи або сегменти, на яких слід проводити дослідження. Після того, як шари або групи були визначені, тоді, якщо для кожної з них зручно застосовувати випадкові вибірки.
- Вкрай малоймовірно, що інформація про сектори меншин буде отримана, про яку іноді потрібно знати їх характеристики.
Наприклад, якщо мова йде про агітацію над дорогим продуктом, необхідно знати переваги найбагатших секторів меншин.
Вправа вирішена
Ми хочемо вивчити вподобання населення до певного напою кола, але попереднього дослідження у цієї популяції немає, розмір якого невідомий.
З іншого боку, вибірка повинна бути репрезентативною з мінімальним рівнем довіри 90%, а висновки повинні мати відсоткову помилку в 2%.
-Як визначити розмір n зразка?
-Яким буде розмір вибірки, якщо похибка буде більш гнучкою до 5%?
Рішення
Оскільки чисельність сукупності невідома, формула, наведена вище, використовується для визначення розміру вибірки:
n = (Z 2 p q) / (E 2 )
Ми припускаємо, що існує однакова ймовірність переваги (p) для нашої марки безалкогольних напоїв, як і не перевагу (q), тому p = q = 0,5.
З іншого боку, оскільки результат дослідження повинен мати відсоткову помилку менше 2%, то відносна похибка Е буде 0,02.
Нарешті, значення Z = 1645 забезпечує рівень довіри 90%.
Підсумовуючи, ми маємо такі значення:
Z = 1645
р = 0,5
q = 0,5
Е = 0,02
За цими даними обчислюється мінімальний розмір вибірки:
n = (1,645 2 0,5 0,5) / (0,02 2 ) = 1691,3
Це означає, що дослідження з необхідною похибкою та з обраним рівнем довіри повинно мати вибірку респондентів щонайменше 1692 осіб, обрану простим випадковим вибіркою.
Якщо ви перейдете від похибки від 2% до 5%, то новий розмір вибірки:
n = (1,645 2 0,5 0,5) / (0,05 2 ) = 271
Це значно менша кількість особин. На закінчення, розмір вибірки дуже чутливий до бажаної похибки дослідження.
Список літератури
- Беренсон, М. 1985. Статистика для управління та економіки, концепцій та застосувань. Редакція Interamericana.
- Статистика. Випадкова вибірка. Взято з: encyclopediaeconomica.com.
- Статистика. Відбір проб. Відновлено з: Estadistica.mat.uson.mx.
- Досліджувані. Випадкова вибірка. Відновлено з: explorable.com.
- Мур, Д. 2005. Прикладна основна статистика. 2-й. Видання.
- Мережа. Випадкова вибірка. Відновлено з: netquest.com.
- Вікіпедія. Статистична вибірка. Відновлено з: en.wikipedia.org