1. Learn
  2. /
  3. Cursuri
  4. /
  5. Testarea ipotezelor în Python

Connected

exercițiu

Vizualizarea mai multor categorii

Până acum în acest capitol, am analizat doar diferențele unei variabile numerice între două categorii. Desigur, multe seturi de date conțin mai multe categorii. Înainte de a efectua teste pe mai multe categorii, este adesea util să realizezi o analiză exploratorie a datelor (EDA): calculezi statistici rezumative pentru fiecare grup și vizualizezi distribuțiile variabilei numerice pentru fiecare categorie cu ajutorul diagramelor box plot.

În acest exercițiu, ne întoarcem la datele despre livrările întârziate și examinăm cum variază prețul fiecărui pachet (pack_price) în funcție de cele trei moduri de livrare (shipment_mode): "Air", "Air Charter" și "Ocean".

late_shipments este disponibil; pandas și matplotlib.pyplot sunt încărcate cu aliasurile lor standard, iar seaborn este încărcat ca sns.

Instrucțiuni 1/3

undefined XP
    1
    2
    3
  • Grupează late_shipments după shipment_mode și calculează media pack_price pentru fiecare grup, stocând rezultatul în xbar_pack_by_mode.