- Згруповані дані
- Приклад
- 3 основні заходи центральної тенденції
- 1- Середнє арифметичне
- 2- Середній
- 3- Мода
- Список літератури
В заходи центральної тенденції згрупованих даних використовуються в статистиці для опису певних поведінки групи поставляються даних, наприклад, яке значення вони близькі, що середнє значення даних , зібраних, серед інших.
Беручи велику кількість даних, корисно згрупувати їх, щоб вони мали кращий порядок і таким чином змогли обчислити певні заходи центральної тенденції.
Серед найбільш широко застосовуваних заходів центральної тенденції - середнє арифметичне, медіана та мода. Ці цифри говорять про певні якості щодо даних, зібраних у певному експерименті.
Для використання цих заходів спочатку потрібно знати, як згрупувати набір даних.
Згруповані дані
Щоб групувати дані, спочатку слід обчислити діапазон даних, який отримують шляхом віднімання найвищого значення за мінусом найменшого значення даних.
Потім вибирається число "k", яке є кількістю класів, в яких ми хочемо згрупувати дані.
Діапазон ділиться на "k", щоб отримати амплітуду класів, які слід згрупувати. Це число C = R / k.
Нарешті, починається групування, для якого вибирається число, менше ніж найменше значення отриманих даних.
Ця кількість буде нижньою межею першого класу. До цього додається С. Отримане значення буде верхньою межею першого класу.
Потім до цієї величини додається С і виходить верхня межа другого класу. Таким чином ми переходимо до отримання верхньої межі останнього класу.
Після групування даних можна розрахувати середню, медіану та режим.
Щоб проілюструвати, як обчислюються середнє арифметичне, медіана та мода, ми продовжимо приклад.
Приклад
Тому при групуванні даних вийде таблиця на зразок наступної:
3 основні заходи центральної тенденції
Тепер ми перейдемо до обчислення середньої арифметичної, медіани та моди. Наведений вище приклад буде використаний для ілюстрації цієї процедури.
1- Середнє арифметичне
Середнє арифметичне складається з множення кожної частоти на середнє значення інтервалу. Потім всі ці результати додаються, і, нарешті, вона ділиться на загальну кількість даних.
Використовуючи попередній приклад, було б отримано, що середнє арифметичне дорівнює:
(4 * 2 + 4 * 4 + 6 * 6 + 4 * 8) / 18 = (8 + 16 + 36 + 32) / 18 = 5.11111
Це вказує на те, що середнє значення даних у таблиці становить 5,11111.
2- Середній
Щоб обчислити медіану набору даних, ми спочатку упорядковуємо всі дані від найменших до найбільших. Можуть статися два випадки:
- Якщо кількість даних непарна, то медіана - це дані, що знаходяться прямо в центрі.
- Якщо кількість даних парне, то медіана - це середнє значення двох даних, що знаходяться в центрі.
Якщо мова йде про згруповані дані, обчислення медіани проводиться наступним чином:
- N / 2 обчислюється, де N - загальна кількість даних.
- Перший інтервал шукається там, де накопичена частота (сума частот) більша за N / 2, і вибирається нижня межа цього інтервалу, що називається Li.
Медіана задається наступною формулою:
Me = Li + (Ls-Li) * (N / 2 - накопичена частота перед Li) / частота [Li, Ls)
Ls - верхня межа вказаного вище інтервалу.
Якщо використовується попередня таблиця даних, N / 2 = 18/2 = 9. Накопичені частоти становлять 4, 8, 14 та 18 (по одній для кожного рядка таблиці).
Тому потрібно вибрати третій інтервал, оскільки кумулятивна частота більша за N / 2 = 9.
Отже Li = 5 і Ls = 7. Застосовуючи описану вище формулу, ви повинні:
Ме = 5 + (7-5) * (9-8) / 6 = 5 + 2 * 1/6 = 5 + 1/3 = 16/3 ≈ 5.3333.
3- Мода
Режим - це значення, яке має найвищу частоту серед усіх згрупованих даних; тобто це значення, яке повторюється найбільше разів у початковому наборі даних.
Якщо у вас дуже великий обсяг даних, для обчислення режиму згрупованих даних використовується наступна формула:
Mo = Li + (Ls-Li) * (частота Li - частота L (i-1)) / ((частота Li - частота L (i-1)) + (частота Li - частота L ( i + 1)))
Інтервал [Li, Ls) - це інтервал, на якому знайдена найвища частота. Для прикладу, зробленого в цій статті, режим задано:
Мо = 5 + (7-5) * (6-4) / ((6-4) + (6-4)) = 5 + 2 * 2/4 = 5 + 1 = 6.
Інша формула, яка використовується для отримання приблизного значення режиму, полягає в наступному:
Mo = Li + (Ls-Li) * (частота L (i + 1)) / (частота L (i-1) + частота L (i + 1)).
За цією формулою рахунки виглядають так:
Мо = 5 + (7-5) * 4 / (4 + 4) = 5 + 2 * 4/8 = 5 + 1 = 6.
Список літератури
- Bellhouse, DR (2011). Abraham De Moivre: Встановлення етапу класичної ймовірності та її застосування. CRC Press.
- Cifuentes, JF (2002). Вступ до теорії ймовірності. Національний університет Колумбії.
- Дастон, Л. (1995). Класична ймовірність в епоху Просвітництва. Прінстонський університетський прес.
- Larson, HJ (1978). Вступ до теорії ймовірностей та статистичного висновку. Редакційна Лімуса.
- Martel, PJ, & Vegas, FJ (1996). Імовірність та математична статистика: застосування в клінічній практиці та управлінні здоров'ям. Видання Діаса де Сантоса.
- Вацкес, А. Л., Ортіс, Ф. Е. (2005). Статистичні методи вимірювання, опису та контролю змінності. Ред. Університету Кантабрії.
- Вацкес, С.Г. (2009). Посібник з математики для доступу до університету. Редакція Centro de Estudios Ramon Areces SA.