1. Learn
  2. /
  3. Курси
  4. /
  5. Перевірка гіпотез у R

Connected

вправа

Візуалізація багатьох категорій

Дотепер у цьому розділі ми розглядали лише різницю числової змінної між двома категоріями. Звісно, багато наборів даних містять більше категорій. Перш ніж переходити до перевірок для багатьох категорій, корисно виконати розвідувальний аналіз даних. Тобто обчислити підсумкові статистики для кожної групи та візуалізувати розподіли числової змінної для кожної категорії за допомогою коробкових діаграм (box plot).

Тут ми знову звернемося до даних про пізні відправлення та подивимося, як змінюється ціна кожної посилки (pack_price) між трьома режимами доставки (shipment_mode): "Air", "Air Charter" і "Ocean".

late_shipments доступний; dplyr і ggplot2 завантажено.

Інструкції 1/2

undefined XP
    1
    2
  • Використовуючи набір даних late_shipments, згрупуйте за shipment_mode.
  • Підсумуйте, щоб обчислити середнє pack_price як xbar_pack_price і стандартне відхилення pack_price як s_pack_price.