- Формула
- Характеристика нормального розподілу
- Інтервали довіри
- Застосування звичайного розподілу
- Приклад
- Вправа вирішена
- Список літератури
Нормальний розподіл або розподіл гауссово є розподіл ймовірностей в безперервної змінної, в якій функція щільності ймовірності описується експоненційною функцією квадратичної і негативного аргументу, що призводить до форми дзвони.
Назва нормального розподілу походить від того, що цей розподіл є тим, який застосовується до найбільшої кількості ситуацій, коли якась суцільна випадкова величина задіяна у певній групі чи сукупності.
Рисунок 1. Нормальний розподіл N (x; μ, σ) та його щільність ймовірності f (s; μ, σ). (Власна розробка)
Прикладами, де застосовується нормальний розподіл, є: зріст чоловіків чи жінок, коливання міри певної фізичної величини або вимірюваних психологічних чи соціологічних рис, таких як інтелектуальний коефіцієнт або звички споживання певного продукту.
З іншого боку, його називають гауссовим розповсюдженням або гауссовим дзвоном, оскільки саме цей німецький математичний геній приписується його відкриттям за використання, яке він дав йому для опису статистичної помилки астрономічних вимірювань ще в 1800 році.
Однак зазначається, що цей статистичний розподіл раніше був опублікований ще одним великим математиком французького походження, таким, як Авраам де Моївр, ще в 1733 році.
Формула
Функція нормального розподілу в безперервній змінній x з параметрами μ і σ позначається:
N (x; μ, σ)
і це прямо написано так:
N (x; μ, σ) = ∫ -∞ x f (s; μ, σ) ds
де f (u; μ, σ) - функція щільності ймовірності:
f (s; μ, σ) = (1 / (σ√ (2π)) Exp (- s 2 / (2σ 2 ))
Константа, що помножує експоненціальну функцію на функцію густини ймовірностей, називається постійною нормалізації, і вона була обрана таким чином, що:
N (+ ∞, μ, σ) = 1
Попередній вираз гарантує, що ймовірність того, що випадкова величина x знаходиться між -∞ та + ∞, дорівнює 1, тобто 100% ймовірність.
Параметр μ - середнє арифметичне безперервної випадкової величини x і σ стандартне відхилення або квадратний корінь дисперсії тієї самої змінної. У випадку, якщо μ = 0 і σ = 1, то маємо стандартний нормальний розподіл або типовий нормальний розподіл:
N (x; μ = 0, σ = 1)
Характеристика нормального розподілу
1- Якщо випадкова статистична величина слідує за нормальним розподілом щільності ймовірності f (s; μ, σ), більшість даних групуються навколо середнього значення μ і розкидаються навколо неї таким чином, що трохи більше, ніж ⅔ даних знаходиться між μ - σ та μ + σ.
2- Стандартне відхилення σ завжди додатне.
3- Форма функції густини f схожа з формою дзвона, тому цю функцію часто називають гауссова дзвіночкою або функцією Гаусса.
4- У розподілі Гаусса середня, медіана та мода збігаються.
5- Точки перегину функції щільності ймовірності знаходяться саме при μ - σ та μ + σ.
6- Функція f симетрична відносно осі, що проходить через її середнє значення μ, і має асимптотично нуль для x ⟶ + ∞ і x ⟶ -∞.
7- Чим вище значення σ, тим більша дисперсія, шум або відстань даних навколо середнього значення. Іншими словами, чим вище σ форма дзвоника, тим відкритіша. З іншого боку, σ малий вказує на те, що кістки близькі до середнього, а форма дзвона є більш закритою або загостреною.
8- Функція розподілу N (x; μ, σ) вказує на ймовірність того, що випадкова величина менша або дорівнює x. Наприклад, на малюнку 1 (вище) ймовірність P, що змінна x менша або дорівнює 1,5, дорівнює 84% і відповідає площі під функцією густини ймовірності f (x; μ, σ) від -∞ до х.
Інтервали довіри
9- Якщо дані відповідають нормальному розподілу, то 68,26% з них знаходяться між μ - σ та μ + σ.
10- 95,44% даних, які слідують за нормальним розподілом, знаходяться між μ - 2σ та μ + 2σ.
11- 99,74% даних, які слідують за нормальним розподілом, знаходяться між μ - 3σ та μ + 3σ.
12- Якщо випадкова величина x слідує за розподілом N (x; μ, σ), то змінна
z = (x - μ) / σ відповідає стандартному нормальному розподілу N (z; 0,1).
Зміна змінної x на z називається стандартизацією або типізацією і є дуже корисною при застосуванні таблиць стандартного розподілу до даних, які слідують за нестандартним нормальним розподілом.
Застосування звичайного розподілу
Для застосування нормального розподілу необхідно пройти обчислення інтеграла щільності ймовірності, що з аналітичної точки зору непросте і не завжди є комп'ютерна програма, яка дозволяє її чисельний розрахунок. Для цього використовуються таблиці нормованих або стандартизованих значень, що є не більш ніж нормальним розподілом у випадку μ = 0 і σ = 1.
Стандартизована нормальна таблиця розподілу (частина 1/2)
Стандартизована нормальна таблиця розподілу (частина 2/2)
Слід зазначити, що ці таблиці не містять негативних значень. Однак, використовуючи властивості симетрії функції щільності ймовірності Гаусса, можна отримати відповідні значення. Розв язана нижче вправа вказує на використання таблиці в цих випадках.
Приклад
Припустимо, у вас є набір випадкових даних x, які відповідають нормальному розподілу середнього значення 10 та стандартному відхиленню 2. Вам пропонується знайти ймовірність того, що:
а) Випадкова величина x менша або дорівнює 8.
б) менше або дорівнює 10.
в) що змінна x нижче 12.
г) Ймовірність того, що значення x знаходиться між 8 і 12.
Рішення:
а) Щоб відповісти на перше запитання, ви просто повинні обчислити:
N (x; μ, σ)
З x = 8, μ = 10 і σ = 2. Ми розуміємо, що це інтеграл, який не має аналітичного рішення в елементарних функціях, але рішення виражається функцією функції помилки erf (x).
З іншого боку, існує можливість вирішення інтеграла в числовій формі, як це роблять багато калькуляторів, електронних таблиць і комп'ютерних програм, таких як GeoGebra. На наступному малюнку показано числове рішення, що відповідає першому випадку:
Малюнок 2. Щільність ймовірності f (x; μ, σ). Затінена область являє собою P (x ≤ 8). (Власна розробка)
і відповідь полягає в тому, що ймовірність того, що x нижче 8, є:
P (x ≤ 8) = N (x = 8; μ = 10, σ = 2) = 0,1587
б) У цьому випадку метою є знайти ймовірність того, що випадкова величина x знаходиться нижче середньої величини, яка в цьому випадку дорівнює 10. Відповідь не потребує жодного обчислення, оскільки ми знаємо, що половина даних знаходиться нижче середня, а інша половина вище середнього. Тому відповідь така:
P (x ≤ 10) = N (x = 10; μ = 10, σ = 2) = 0,5
в) Щоб відповісти на це запитання, ми повинні обчислити N (x = 12; μ = 10, σ = 2), що можна зробити за допомогою калькулятора, що має статистичні функції, або за допомогою програмного забезпечення, такого як GeoGebra:
Малюнок 3. Щільність ймовірності f (x; μ, σ). Затінена область являє собою P (x ≤ 12). (Власна розробка)
Відповідь на частину c можна побачити на малюнку 3 і така:
P (x ≤ 12) = N (x = 12; μ = 10, σ = 2) = 0,8413.
г) Щоб знайти ймовірність того, що випадкова величина x знаходиться між 8 і 12, ми можемо використовувати результати частин a і c таким чином:
P (8 ≤ x ≤ 12) = P (x ≤ 12) - P (x ≤ 8) = 0,8413 - 0,1587 = 0,6826 = 68,26%.
Вправа вирішена
Середня ціна акцій компанії - 25 доларів при стандартному відхиленні в 4 долари. Визначте ймовірність того, що:
а) Вартість акції менша за 20 доларів.
б) вартість яких перевищує 30 доларів.
в) Ціна становить від 20 до 30 доларів.
Скористайтесь стандартними нормальними таблицями розподілу, щоб знайти відповіді.
Рішення:
Для використання таблиць необхідно перейти до нормалізованої або введеної змінної z:
$ 20 у нормованій змінній дорівнює z = ($ 20 - $ 25) / $ 4 = -5/4 = -1,25 і
$ 30 у нормованій змінній дорівнює z = ($ 30 - $ 25) / $ 4 = +5/4 = +1,25.
а) $ 20 дорівнює -1,25 у нормованій змінній, але у таблиці немає негативних значень, тому ми знаходимо значення +1,25, яке дає значення 0,8944.
Якщо від цього значення відняти 0,5, результатом буде площа між 0 і 1,25, яка, до речі, ідентична (за симетрією) площі між -1,25 і 0. Результатом віднімання є 0,8944 - 0,5 = 0,3944, що є площею від -1,25 до 0.
Але інтерес представляє площа від -∞ до -1,25, яка складе 0,5 - 0,3944 = 0,1056. Тому робиться висновок, що ймовірність того, що акції нижче 20 доларів, становить 10,56%.
б) $ 30 у введеній змінній z дорівнює 1,25. Для цього значення в таблиці відображається число 0,8944, що відповідає площі від -∞ до +1,25. Площа між +1,25 та + ∞ дорівнює (1 - 0,8944) = 0,1056. Іншими словами, ймовірність того, що вартість акції перевищує 30 доларів, становить 10,56%.
в) Ймовірність того, що вартість дії складе від 20 до 30 доларів США, обчислюється так:
100% -10,56% - 10,56% = 78,88%
Список літератури
- Статистика та ймовірність. Нормальний розподіл. Відновлено з: projectdescartes.org
- Геогебра. Класична геогебра, імовірне обчислення. Відновлено з geogebra.org
- MathWorks. Гауссова розподіл. Відновлено з: es.mathworks.com
- Mendenhall, W. 1981. Статистика для менеджменту та економіки. 3-й. видання. Grupo Редакція Iberoamérica.
- Стат Трек. Навчіть себе статистику. Розподіл Пуассона. Відновлено з: stattrek.com,
- Тріола, М. 2012. Елементарна статистика. 11-й. Освіта за ред. Пірсона.
- Університет Віго. Основні безперервні дистрибуції. Відновлено з: anapg.webs.uvigo.es
- Вікіпедія. Нормальний розподіл. Відновлено з: es.wikipedia.org