1. Learn
  2. /
  3. Courses
  4. /
  5. Testowanie hipotez w Pythonie

Connected

Exercise

Wizualizacja wielu kategorii

Do tej pory w tym rozdziale rozpatrywaliśmy różnice w zmiennej numerycznej między dwiema kategoriami. Oczywiście wiele zbiorów danych zawiera więcej kategorii. Zanim przystąpisz do testowania wielu kategorii, warto przeprowadzić eksploracyjną analizę danych (EDA) – obliczyć statystyki podsumowujące dla każdej grupy i zwizualizować rozkłady zmiennej numerycznej dla każdej kategorii za pomocą wykresów pudełkowych.

Wrócimy tu do danych o opóźnionych dostawach i sprawdzimy, jak cena opakowania (pack_price) różni się między trzema trybami wysyłki (shipment_mode): "Air", "Air Charter" i "Ocean".

Zbiór late_shipments jest dostępny; pandas i matplotlib.pyplot są załadowane ze standardowymi aliasami, a seaborn jest załadowany jako sns.

Instructions 1/3

undefined XP
    1
    2
    3
  • Pogrupuj late_shipments według shipment_mode i oblicz średnią wartość pack_price dla każdej grupy, zapisując wynik w zmiennej xbar_pack_by_mode.