1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Testování hypotéz v Pythonu

Connected

cvičení

Testování velikosti vzorku

Aby byl výsledek hypotézového testu spolehlivý, musí vzorek splňovat tři požadavky: jde o náhodný výběr z populace, pozorování jsou nezávislá a je jich dostatečný počet. Z těchto podmínek lze kódem snadno ověřit pouze tu poslední.

Minimální velikost vzorku závisí na typu hypotézového testu, který chceš provést. Otestuj teď různé scénáře na datasetu late_shipments.

Všimni si, že metodu .all() z pandas lze použít ke kontrole, zda jsou všechny prvky pravdivé. Například u DataFrame df s číselnými hodnotami ověříš, zda jsou všechny jeho prvky menší než 5, takto: (df < 5).all().

late_shipments je k dispozici a pandas je načtený jako pd.

Instrukce 1/4

undefined XP
  • 1
    • Zjisti počet výskytů každé hodnoty ve sloupci freight_cost_group v late_shipments.
    • Doplň vhodné číslo pro ověření, zda jsou počty „dostatečně velké" pro dvouvýběrový t-test.
  • 2
    • Zjisti počet výskytů každé hodnoty ve sloupci late v late_shipments.
    • Doplň vhodné číslo pro ověření, zda jsou počty „dostatečně velké" pro jednovýběrový proporční test.
  • 3
    • Zjisti počet výskytů každé hodnoty ve sloupci freight_cost_group v late_shipments seskupeném podle vendor_inco_term.
    • Doplň vhodné číslo pro ověření, zda jsou počty „dostatečně velké" pro test nezávislosti chí-kvadrát.
  • 4
    • Zjisti počet výskytů každé hodnoty ve sloupci shipment_mode v late_shipments.
    • Doplň vhodné číslo pro ověření, zda jsou počty „dostatečně velké" pro ANOVA test.