- Що таке гістограма?
- Для чого складається гістограма?
- Типи та приклади гістограм
- Горизонтальні гістограми
- Кластерні діаграми
- Складена гістограма
- Гістограма
- Список літератури
Гістограму , яка також називається гістограма, є спосіб представлення даних, значень або частоти, які пов'язані один з одним, використовуючи вертикальні або горизонтальні смуги. Довжина їх пропорційна величині, яку вони представляють.
Штрихові графіки дуже корисні не тільки тому, що дозволяють побачити тенденції змінних з першого погляду, але й тому, що їх легко побудувати та інтерпретувати.
Рисунок 1. Діаграма, що показує залежність між прибутком від продажу певного товару та місяцем. Джерело: Pixabay.
Наприклад, у нас є графік вище, який показує прибуток магазину при продажу певного товару протягом перших 6 місяців року. Тенденція вгору, на що вказує стрілка.
Що таке гістограма?
Щоб бути корисним, графік повинен мати:
- Заголовок: дуже важливо мати заголовок на видимому місці, де коротко описано, з чим порівнюється.
- дискретні категорії в одній з осей : які у прикладі відповідають місяцям року, представлені безпосередньо їх назвами на горизонтальній осі. Зауважте, що для категорій немає шкали, а ширина всіх барів однакова.
Також бруски є окремими, що вказує на те, що категорії дискретні. Це означає, що вони не мають нескінченних значень через певний кінцевий інтервал.
- Числова величина на іншій осі : у прикладі вони відповідають прибутку на місяць від продажів, зазначених у $, і він розташований на вертикальній осі. Це ще один дуже важливий момент, оскільки одиниці повинні бути визначені ретельно. Також на вертикальній осі є шкала, яка в цьому випадку йде від $ 1000 до $ 1000.
- Належного розміру : графіку потрібно легко переглядати, дуже маленька графіка недостатньо добре читається.
Для чого складається гістограма?
Штрихові діаграми дозволяють швидко візуалізувати тенденції та поведінку.
Їх дуже легко зробити як вручну, що вже не є стилем, так і в електронних таблицях типу Excel та спеціалізованому програмному забезпеченні. З ними можна порівнювати багато типів даних: номінальні або числові.
Номінальні дані - інформативні, наприклад, місяці року, дні, сімейний стан, кольори, країна народження, назва суб’єктів різних професій і багато іншого.
Числові дані можна певним чином упорядкувати, класифікувати, згрупувати або квантувати. Негативні значення також допускаються, якщо це необхідно, і в цьому випадку смуга знаходиться нижче горизонтальної осі.
Типи та приклади гістограм
У прикладі, наведеному на початку, був показаний один з найбільш використовуваних типів гістограми, наприклад вертикальні смуги.
Однак штрихові діаграми мають більшу універсальність, тому їх можна створювати іншими способами, дотримуючись викладених основних принципів.
Наприклад, бруски можуть бути горизонтальними, і декілька категорій можуть бути представлені одночасно. Нижче наведено кілька прикладів.
Горизонтальні гістограми
У цих типах графіків горизонтальна довжина смуги вказує на величину представленої категорії. Це вигідно, якщо номінальні імена даних занадто довгі, щоб ставити їх у нижній частині вертикальної смуги.
Вони також підходять, коли кількість велика, якщо їх більше 10 бар, або якщо наявного простору просто недостатньо для створення вертикальної смуги.
Далі ми маємо хороший приклад на цьому графіку відсотків електроенергії, отриманої від енергії вітру в 15 штатах США, які зазвичай використовують це джерело енергії.
Малюнок 2. Приклад горизонтальної гістограми. Джерело: Wikimedia Commons.
Цього разу шкала знаходиться на горизонтальній осі, але також окремі відсотки були розміщені безпосередньо на кожному бруску для полегшення аналізу.
Також спостерігається, що бруски починаються найдовше, а потім зменшуються.
Це відповідний спосіб подання даних, оскільки ви завжди завжди бажаєте виділити найбільше значення з одного боку і найменше з іншого, хоча дані не завжди піддаються цьому.
У цьому прикладі штат із найвищим відсотком електроенергії, виробленої енергією вітру, - Південна Дакота, а найнижча - Монтана, закриваючи графік.
Кластерні діаграми
Коли є кілька категорій для порівняння з певною числовою величиною, немає проблеми при призначенні смуги до кожної категорії, яка зазвичай відрізняється певним кольором або відтінком. Таким чином представлені підмножини категорії.
У цьому графіку ви повинні додати ключ, щоб швидко розпізнати, яка є смужка, призначена певній категорії. Цей ключ повинен знаходитись на видимому місці, яке може бути в межах самого графіка або нижче горизонтальної осі.
Кластеризовані гістограми можуть відображатися вертикально або горизонтально, залежно від потреб у просторі.
Однак слід подбати про те, щоб не включати занадто багато підгруп чи підкатегорій, оскільки в іншому випадку аналіз стає важким, і первісна мета, яка полягає в наданні інформації, втрачається.
Малюнок 3. Кластерна гістограма. Джерело: Wikimedia Commons.
Складена гістограма
Підгрупи також представлені в діаграмі цього типу, але замість того, щоб використовувати окремі смуги, використовується одна і та ж панель. Підгрупа розміщується поверх іншої, якщо смужка вертикальна, або поруч із нею, якщо вона горизонтальна.
Висота або довжина смужки - це числове значення, присвоєне всій категорії, а внесок кожної підкатегорії вказується над сегментованою смугою, або в абсолютних значеннях, або у відсотках.
Складені діаграми дуже корисні для порівняння ефекту кожної підгрупи на загальну для категорії. Однак іноді значення кожної підгрупи не вказуються, і спостерігачеві доводиться знаходити їх за допомогою градуйованої шкали на відповідній осі. Іноді це може ускладнитися.
Як і в попередньому прикладі, не бажано надмірно сегментувати панель, оскільки це бентежить читача. Рекомендований максимум - 5 підгруп.
Ось приклад з двома змінними та гіпотетичними даними.
Малюнок 4. Складена гістограма. Джерело: Wikimedia Commons. Innesw / CC BY-SA (https://creativecommons.org/licenses/by-sa/3.0)
Гістограма
Нарешті, у нас є гістограма, подання, яке також використовує бруски і широко використовується в описовій статистиці. Вони дуже корисні, оскільки вказують на спосіб розподілу населення.
У простій гістограмі частоти розміщуються на вертикальній осі, а на горизонтальній осі - значення або діапазон значень, які приймає змінна. Висота смуги - це частота, про яку йдеться, тоді як ширина супроводжує значення або діапазон значень змінної.
Наприклад, діапазон значень може бути віковим діапазоном дітей, організованим так: 0–6 років, 6–12 років, 12–18 років та числові значення, такі як середній зріст, вага або інші, можуть йти по вертикальній осі .
У гістограмі наступного малюнка було обрано поділ населення на 18 осіб, які пройшли аналіз крові на ЛПВЩ на холестерин.
Діапазон значень холестерину становить від 40 до 70 мг / дл, популяція була згрупована у 6 категорій. Найдовша планка, що містить 6 осіб, має значення від 50 до 55 мг / дл холестерину ЛПВЩ у крові.
Малюнок 5. Гістограма 18 людей, які пройшли тест на холестерин. Джерело: Wikimedia Commons.
Список літератури
- Центр знань IBM Визначення гістограми. Відновлено з: ibm.com
- УНАМ. Барні діаграми. Відновлено з: asesorias.cuautitlan2.unam.mx.
- Університет Лестера. Барні діаграми. Відновлено: www2.le.ac.uk.
- Вікіпедія. Барна графіка. Відновлено з: eu.wikipedia.org.
- Вікіпедія. Гістограма. Відновлено з: es.wikipedia.org.