- Формули та рівняння
- Важливі статистичні змінні
- Модель та властивості
- Основні властивості гіпергеометричного розподілу
- Апроксимація з використанням біноміального розподілу
- Приклад 2
- Розв’язані вправи
- Вправа 1
- Рішення
- Вправа 2
- Рішення
- Вправа 3
- Рішення для
- Розв’язання c
- Список літератури
Гіпергеометричний розподіл є дискретної статистичної функцією, підходить для обчислення ймовірності в рандомізованих експериментах з двома можливими результатами. Умовою, яку потрібно застосувати, є те, що це невеликі групи населення, в яких вилучення не замінюються і ймовірності не є постійними.
Тому, коли елемент сукупності обраний, щоб знати результат (істинний чи хибний) певної характеристики, той самий елемент не може бути обраний знову.
Малюнок 1. У такої популяції болтів, безумовно, є дефекти. Джерело: Pixabay.
Безумовно, наступний обраний елемент, таким чином, має більше шансів отримати справжній результат, якщо попередній елемент мав негативний результат. Це означає, що ймовірність змінюється, оскільки елементи витягуються з вибірки.
Основними сферами застосування гіпергеометричного розподілу є: контроль якості в процесах з малою кількістю населення та обчислення ймовірностей в ігрових ситуаціях.
Щодо математичної функції, що визначає гіпергеометричний розподіл, вона складається з трьох параметрів, які є:
- Кількість елементів популяції (N)
- розмір вибірки (м)
- Кількість подій у всій сукупності зі сприятливим (або несприятливим) результатом досліджуваної характеристики (n).
Формули та рівняння
Формула гіпергеометричного розподілу дає ймовірність Р, що трапляються х сприятливі випадки певної характеристики. Спосіб написати це математично на основі комбінаторних чисел:
У попередньому виразі N, n і m - параметри, а x - сама змінна.
- Загальна чисельність населення - Н.
-Кількість позитивних результатів певної бінарної характеристики щодо загальної сукупності становить n.
-Кількість елементів у зразку становить m.
У цьому випадку X - випадкова величина, яка приймає значення x, а P (x) вказує на ймовірність виникнення x сприятливих випадків досліджуваної характеристики.
Важливі статистичні змінні
Іншими статистичними змінними для гіпергеометричного розподілу є:
- середнє μ = m * n / N
- Варіант σ ^ 2 = m * (n / N) * (1-n / N) * (Nm) / (N-1)
- Стандартне відхилення σ, яке є квадратним коренем дисперсії.
Модель та властивості
Щоб дійти до моделі гіпергеометричного розподілу, виходимо з ймовірності отримання х сприятливих випадків у вибірці розміром m. Цей зразок містить елементи, які відповідають властивості, що вивчається, та елементи, які не відповідають цим.
Нагадаємо, що n представляє кількість сприятливих випадків у загальній сукупності N елементів. Тоді ймовірність буде обчислюватися так:
Висловлюючи вищезазначене у вигляді комбінаторних чисел, досягається наступна модель розподілу ймовірностей:
Основні властивості гіпергеометричного розподілу
Вони такі:
- Вибірка завжди повинна бути невеликою, навіть якщо кількість населення велика.
- Елементи вибірки видобуваються по черзі, не включаючи їх назад до сукупності.
- Властивість, яку слід вивчати, є бінарною, тобто може приймати лише два значення: 1 або 0, або істинне, або хибне.
На кожному етапі вилучення елемента ймовірність змінюється залежно від попередніх результатів.
Апроксимація з використанням біноміального розподілу
Ще одна властивість гіпергеометричного розподілу полягає в тому, що воно може бути наближене до біноміального розподілу, позначеного Bi, до тих пір, поки популяція N велика і принаймні в 10 разів більша за зразок m. У цьому випадку це виглядатиме так:
Ймовірність того, що х = 3 гвинта у зразку є несправними: P (500, 5, 60, 3) = 0,0129.
Зі свого боку, ймовірність того, що x = 4 гвинта з шестидесяти зразка є несправними, становить: P (500, 5, 60; 4) = 0,0008.
Нарешті, ймовірність того, що х = 5 гвинтів у цьому зразку є несправними: P (500, 5, 60; 5) = 0.
Але якщо ви хочете дізнатись про ймовірність того, що в цьому зразку є більше 3 несправних гвинтів, вам доведеться отримати сукупну ймовірність, додавши:
Цей приклад проілюстрований на малюнку 2, отриманому за допомогою GeoGebra, вільного програмного забезпечення, яке широко використовується в школах, інститутах та університетах.
Малюнок 2. Приклад гіпергеометричного розподілу. Підготував Ф. Сапата з GeoGebra.
Приклад 2
В іспанській настильній колоді є 40 карт, з яких 10 мають золото, а решта 30 - ні. Припустимо, що 7 карт витягуються навмання з цієї колоди, які не перекомпортуються у колоду.
Якщо X - кількість золотих, присутніх на 7 намальованих картах, то ймовірність того, що у вас буде x золотих у розіграші 7 карт, задається гіпергеометричним розподілом P (40,10,7; x).
Подивимось так: для обчислення ймовірності наявності 4 золотих у розіграші 7 карт використовуємо формулу гіпергеометричного розподілу із наступними значеннями:
І результат такий: 4,57% ймовірність.
Але якщо ви хочете знати ймовірність отримати більше 4 карт, то вам доведеться додати:
Розв’язані вправи
Наступний набір вправ призначений для ілюстрації та засвоєння понять, які були представлені в цій статті. Важливо, щоб читач намагався їх вирішити самостійно, перш ніж дивитися на рішення.
Вправа 1
Фабрика презервативів виявила, що з кожних 1000 презервативів, вироблених певною машиною, 5 є несправними. Для контролю якості беруть випадково 100 презервативів, і партія відхиляється, якщо є хоча б один або кілька несправних. Відповідь:
а) Яка ймовірність того, що партія 100 буде відкинута?
б) Чи ефективний цей критерій контролю якості?
Рішення
У цьому випадку з’являться дуже великі комбінаторні числа. Розрахунок важкий, якщо у вас немає відповідного програмного пакету.
Але оскільки це велика популяція і вибірка вдесятеро менша, ніж загальна популяція, можна використовувати наближення гіпергеометричного розподілу біноміальним розподілом:
У наведеному вище виразі C (100, x) - комбінаторне число. Тоді ймовірність наявності декількох несправних буде обчислена так:
Це відмінне наближення, якщо порівнювати зі значенням, отриманим при застосуванні гіпергеометричного розподілу: 0,4102
Можна сказати, що з 40% -ною ймовірністю партію з 100 профілактичних засобів слід відмовитися, що не дуже ефективно.
Але, будучи трохи менш вимогливим до процесу контролю якості та відкидання партії 100 лише у випадку, якщо є два або більше дефектів, то ймовірність викидання партії впаде до всього 8%.
Вправа 2
Машина з пластикового блоку працює таким чином, що з кожні 10 штук виходить деформований. На вибірці з 5 штук, наскільки ймовірно, що лише одна штука є несправною?
Рішення
Населення: N = 10
Кількість n дефектів для кожного N: n = 1
Розмір вибірки: m = 5
Тому існує 50% ймовірність того, що в зразку 5 блок буде деформований.
Вправа 3
На зустрічі молодих випускників середньої школи присутні 7 дам та 6 джентльменів. Серед дівчат 4 навчальні гуманітарні науки та 3 науки. У хлопчачій групі 1 вивчення гуманітарних наук та 5 наук. Обчисліть наступне:
а) Вибір випадкових трьох дівчат: наскільки ймовірно, що всі вони вивчають гуманітарні науки?
б) Якщо трьох учасників зустрічі друзів обрано випадковим чином: Яка можливість, що троє з них, незалежно від статі, вивчають науку всіх трьох, або гуманітарні науки також усі троє?
c) Тепер виберіть двох друзів навмання і назвіть x випадкову змінну "кількість тих, хто вивчає гуманітарні науки". Між двома вибраними визначте середнє або очікуване значення x та дисперсію σ ^ 2.
Рішення для
Зараз використовуються такі значення:
-Населення: N = 14
-Кількість, яка вивчає букви, становить: n = 6 і
-Размір вибірки: m = 3.
-Кількість друзів, які вивчають гуманітарні науки: x
Відповідно до цього, x = 3 означає, що всі три вивчають гуманітарні науки, але x = 0 означає, що ніхто не вивчає гуманітарних наук. Ймовірність того, що всі троє навчаються однаково, задається сумою:
P (14, 6, 3, x = 0) + P (14, 6, 3, x = 3) = 0,0560 + 0,1539 = 0,2099
Тоді у нас є 21% ймовірність, що троє учасників зустрічей, вибраних навмання, вивчать одне і те ж.
Розв’язання c
Тут ми маємо такі значення:
N = 14 загальна кількість друзів, n = 6 загальна кількість населення, що вивчає гуманітарні науки, розмір вибірки m = 2.
Надія така:
E (x) = m * (n / N) = 2 * (6/14) = 0,8572
І дисперсія:
σ (x) ^ 2 = m * (n / N) * (1-n / N) * (Nm) / (N-1) = 2 * (6/14) * (1-6 / 14) * ( 14-2) / (14-1) =
= 2 * (6/14) * (1-6 / 14) * (14-2) / (14-1) = 2 * (3/7) * (1-3 / 7) * (12) / ( 13) = 0,4521
Список літератури
- Дискретний розподіл ймовірностей. Відновлено з: biplot.usal.es
- Статистика та ймовірність. Гіпергеометричний розподіл. Відновлено з: projectdescartes.org
- CDPYE-UGR. Гіпергеометричний розподіл. Відновлено з: ugr.es
- Геогебра. Класична геогебра, імовірне обчислення. Відновлено з geogebra.org
- Спробуйте легко. Вирішили проблеми гіпергеометричного розподілу. Відновлено: probafacil.com
- Мінітаб. Гіпергеометричний розподіл. Відновлено з: support.minitab.com
- Університет Віго. Основні дискретні розподіли. Відновлено з: anapg.webs.uvigo.es
- Вітутор. Статистика та комбінаторика. Відновлено з: vitutor.net
- Вайштайн, Ерік В. Гіпергеометричне розподіл. Відновлено з: mathworld.wolfram.com
- Вікіпедія. Гіпергеометричний розподіл. Відновлено з: es.wikipedia.com