1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Statistical Thinking in Python (Part 2)

Connected

cvičení

Analogie s časem stráveným na webu

Ukazuje se, že jsi již provedl/a test hypotézy analogický k A/B testu, kde nás zajímá, kolik času uživatelé strávili na webu před reklamní kampaní a po ní. Síla žabího jazyka (spojitá veličina podobná době strávené na webu) je vhodnou analogií. „Před" = žába A, „po" = žába B. Pojďme si to procvičit na scénáři, který je opravdu typem „před/po".

Vracíme se k datové sadě no-hitterů. V roce 1920 zavedla Major League Baseball důležité změny pravidel, které ukončily tzv. éru mrtvého míče. Klíčovou změnou byl zákaz plinutí na míč nebo jeho poškrábání – praktik, které výrazně zvýhodňovaly nadhazovače. V tomto cvičení provedeš A/B test, jehož cílem je zjistit, zda tyto změny pravidel vedly k pomalejšímu tempu no-hitterů (tedy k delší průměrné době mezi nimi). Jako testovací statistiku použiješ rozdíl průměrných časů mezi no-hittery. Časy mezi no-hittery pro jednotlivé éry jsou uloženy v polích nht_dead a nht_live, kde „nht" označuje „no-hitter time".

Protože v tomto cvičení použiješ funkci draw_perm_reps(), může být užitečné si připomenout její signaturu: draw_perm_reps(d1, d2, func, size=1), případně se vrátit ke cvičení z kapitoly 3, kde jsi ji definoval/a.

Pokyny

100 XP
  • Pomocí diff_of_means() vypočítej pozorovaný rozdíl průměrných časů mezi no-hittery.
  • Pomocí draw_perm_reps() vygeneruj 10 000 permutačních replikátů rozdílu průměrů.
  • Vypočítej a vypiš p-hodnotu.