1. Learn
  2. /
  3. Kurser
  4. /
  5. Hypotestestning i Python

Connected

övning

Visualisera många kategorier

Hittills i det här kapitlet har vi bara tittat på skillnader i en numerisk variabel mellan två kategorier. Många datamängder innehåller förstås fler kategorier än så. Innan du genomför tester på många kategorier är det ofta bra att utföra en explorativ dataanalys (EDA) – beräkna sammanfattande statistik för varje grupp och visualisera fördelningarna av den numeriska variabeln för varje kategori med hjälp av lådagram.

Här återvänder vi till data om försenade leveranser och undersöker hur priset per paket (pack_price) varierar mellan de tre fraktsätten (shipment_mode): "Air", "Air Charter" och "Ocean".

late_shipments finns tillgängligt; pandas och matplotlib.pyplot är inlästa med sina standardalias, och seaborn är inläst som sns.

Instruktioner 1/3

undefined XP
    1
    2
    3
  • Gruppera late_shipments efter shipment_mode och beräkna medelvärdet av pack_price för varje grupp. Lagra resultatet i xbar_pack_by_mode.