Un analogo del tempo sul sito web
Risulta che hai già eseguito un test d'ipotesi analogo a un test A/B in cui ti interessa quanto tempo viene trascorso sul sito prima e dopo una campagna pubblicitaria. La forza della lingua della rana (una quantità continua come il tempo sul sito) è un analogo. "Prima" = Rana A e "dopo" = Rana B. Facciamolo di nuovo con qualcosa che è davvero uno scenario prima/dopo.
Torniamo all'insieme di dati sui no-hitter. Nel 1920, la Major League Baseball introdusse importanti cambiamenti alle regole che misero fine alla cosiddetta dead ball era. In particolare, al lanciatore non era più consentito sputare sulla palla o graffiarla, un'attività che favoriva molto i pitcher. In questo esercizio eseguirai un test A/B per determinare se questi cambiamenti hanno comportato un tasso più lento di no-hitter (cioè un tempo medio più lungo tra no-hitter) usando la differenza nel tempo medio tra no-hitter come statistica test. I tempi tra no-hitter per le rispettive epoche sono memorizzati negli array nht_dead e nht_live, dove "nht" sta per "no-hitter time".
Poiché in questo esercizio userai la tua funzione draw_perm_reps(), può essere utile ricordare la sua firma: draw_perm_reps(d1, d2, func, size=1) o persino tornare a dare un'occhiata all'esercizio del capitolo 3 in cui l'hai definita.
Questo esercizio fa parte del corso
Pensiero statistico in Python (Parte 2)
Istruzioni dell'esercizio
- Calcola la differenza osservata nel tempo medio tra no-hitter usando
diff_of_means(). - Genera 10.000 repliche per permutazione della differenza di medie usando
draw_perm_reps(). - Calcola e stampa il p-value.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Compute the observed difference in mean inter-no-hitter times: nht_diff_obs
nht_diff_obs = ____
# Acquire 10,000 permutation replicates of difference in mean no-hitter time: perm_replicates
perm_replicates = ____
# Compute and print the p-value: p
p = ____
print('p-val =', p)