1. Learn
  2. /
  3. Курси
  4. /
  5. Тестування гіпотез у Python

Connected

вправа

Візуалізація багатьох категорій

У цьому розділі ми розглядали лише відмінності в числовій змінній між двома категоріями. Звісно, у багатьох наборах даних категорій більше. Перш ніж переходити до тестів для багатьох категорій, корисно провести розвідувальний аналіз даних (EDA): обчислити зведену статистику для кожної групи та візуалізувати розподіли числової змінної для кожної категорії за допомогою діаграм разків (box plot).

Тут ми повертаємося до даних про запізнілі відправлення і подивимось, як ціна кожної посилки (pack_price) відрізняється між трьома режимами відправлення (shipment_mode): "Air", "Air Charter" і "Ocean".

late_shipments доступний; pandas і matplotlib.pyplot завантажені зі стандартними псевдонімами, а seaborn завантажений як sns.

Інструкції 1/3

undefined XP
    1
    2
    3
  • Згрупуйте late_shipments за shipment_mode і обчисліть середнє значення pack_price для кожної групи, зберігши результат у xbar_pack_by_mode.