- Розподіл частоти
- Скільки класів врахувати?
- Як його отримують?
- Приклад
- Для чого це?
- Приклад
- Список літератури
Клас марка , відома також як середня точка, це значення в центрі класу, який представляє всі значення , які перебувають у цій категорії. Принципово марка класу використовується для обчислення певних параметрів, таких як середнє арифметичне або стандартне відхилення.
Отже марка класу - це середина будь-якого інтервалу. Це значення також дуже корисно для пошуку дисперсії набору даних, вже згрупованих у класи, що в свою чергу дозволяє зрозуміти, наскільки далеко від центру розташовані ці конкретні дані.
Розподіл частоти
Щоб зрозуміти, що таке марка класу, необхідна концепція розподілу частоти. Враховуючи набір даних, розподіл частоти - це таблиця, яка розділяє дані на ряд категорій, які називаються класами.
У цій таблиці показано кількість елементів, що належать до кожного класу; остання відома як частота.
Ця таблиця жертвує частиною інформації, яку ми отримуємо з даних, оскільки замість того, щоб мати індивідуальне значення кожного елемента, ми знаємо лише, що він належить до цього класу.
З іншого боку, ми отримуємо краще розуміння набору даних, оскільки таким чином легше оцінити встановлені зразки, що полегшує маніпулювання зазначеними даними.
Скільки класів врахувати?
Щоб виконати розподіл частоти, ми повинні спочатку визначити кількість класів, які ми хочемо прийняти, та вибрати їхні обмеження класів.
Вибір кількості занять повинен бути зручним, беручи до уваги, що невелика кількість класів може приховувати інформацію про дані, які ми хочемо вивчити, а дуже великі - можуть створювати занадто багато деталей, які не обов'язково корисні.
Фактори, які ми повинні враховувати, обираючи, скільки класів взяти кілька, але серед цих двох виділяємось: перший - це врахувати, скільки даних ми маємо враховувати; друге - знати, наскільки великий діапазон розподілу (тобто різниця між найбільшим і найменшим спостереженням).
Після того, як класи вже були визначені, переходимо до підрахунку кількості даних у кожному класі. Це число називається частотою занять і позначається fi.
Як ми вже говорили раніше, ми маємо на увазі, що розподіл частоти втрачає інформацію, яка надходить окремо від кожного даних або спостереження. З цієї причини шукається значення, яке представляє весь клас, до якого він належить; це значення є позначкою класу.
Як його отримують?
Марка класу - це основне значення, яке представляє клас. Він отримується додаванням меж інтервалу і діленням цього значення на два. Ми можемо виразити це математично так:
x i = (нижня межа + верхня межа) / 2.
У цьому виразі x i позначається марка i класу.
Приклад
Враховуючи наступний набір даних, дайте репрезентативний розподіл частоти та отримайте відповідну оцінку класу.
Оскільки дані з найвищим числовим значенням - 391, а найнижчим - 221, ми маємо, що діапазон - 391 -221 = 170.
Ми оберемо 5 класів, всі з однаковим розміром. Один із способів вибору занять полягає в наступному:
Зауважте, що всі дані в класі, вони неперервні та мають однакове значення. Інший спосіб вибору класів - це розгляд даних як частини суцільної змінної, яка може досягти будь-якого реального значення. У цьому випадку ми можемо розглянути класи форми:
205-245, 245-285, 285-325, 325-365, 365-405
Однак такий спосіб групування даних може представляти певні неоднозначності з межами. Наприклад, у випадку 245 виникає питання: до якого класу він належить, перший чи другий?
Щоб уникнути цієї плутанини, складається конвенція про кінцеву точку. Таким чином, першим класом буде інтервал (205,245], другий (245,285] тощо).
Після визначення класів ми переходимо до обчислення частоти і маємо таку таблицю:
Отримавши частотний розподіл даних, переходимо до значень класів кожного інтервалу. По суті, ми повинні:
х 1 = (205+ 245) / 2 = 225
х 2 = (245+ 285) / 2 = 265
х 3 = (285+ 325) / 2 = 305
х 4 = (325+ 365) / 2 = 345
х 5 = (365+ 405) / 2 = 385
Ми можемо представити це за допомогою наступного графіка:
Для чого це?
Як було сказано раніше, марка класу є дуже функціональною для пошуку середнього арифметичного та дисперсії групи даних, які вже були згруповані в різні класи.
Ми можемо визначити середнє арифметичне як суму спостережень, отриманих між розміром вибірки. З фізичної точки зору, його інтерпретація подібна до точки рівноваги набору даних.
Ідентифікація цілого набору даних за допомогою одного числа може бути ризикованою, тому різницю між цією точкою беззбитковості та фактичними даними також слід враховувати. Ці значення відомі як відхилення від середнього арифметичного, і за допомогою них ми прагнемо визначити, наскільки змінюється середнє арифметичне даних.
Найпоширеніший спосіб знайти це значення - це дисперсія, яка є середньою площею відхилень від середнього арифметичного.
Для обчислення середнього арифметичного та дисперсії набору даних, згрупованих у класі, ми використовуємо відповідно такі формули:
У цих виразах x i є позначення i-го класу, f i являє собою відповідну частоту, k - кількість класів, в яких були згруповані дані.
Приклад
Використовуючи дані, наведені в попередньому прикладі, ми маємо можливість розширити трохи більше даних таблиці розподілу частот. Ви отримуєте наступне:
Потім, замінюючи дані у формулу, нам залишається середнє арифметичне як:
Його дисперсія та стандартне відхилення:
З цього можна зробити висновок, що вихідні дані мають середнє арифметичне 306,6 та стандартне відхилення 39,56.
Список літератури
- Фернандес Ф. Сантьяго, Кордова Л. Алехандро, Кордеро С. Хосе М. Описова статистика. Редакція Esic.
- Джонсон Річард А. Міллер та Фрейнд Вірогідність та державні діячі для інженерів.
- Miller I & Freund J. Вірогідність та державні діячі для інженерів. РЕВЕРТ.
- Сарабія А. Хосе Марія, Паскуаль Марта. Базовий курс статистики для компаній
- Llinás S. Humberto, Rojas A. Carlos Описова статистика та розподіл ймовірностей, Universidad del Norte