Riepilogo del costo opportunità (2)
Ora che hai creato la distribuzione di randomizzazione, la userai per valutare se la differenza osservata tra proporzioni è coerente con la differenza nulla. Misurerai questa coerenza (o la sua assenza) con un p-value, ovvero la proporzione di differenze permutate minori o uguali alla differenza osservata.
Il dataset permutato e la statistica osservata originale sono disponibili nel tuo workspace rispettivamente come opp_perm e diff_orig.
Usa visualize e get_p_value con le funzioni integrate di infer. Ricorda che le statistiche sotto l'ipotesi nulla si trovano al di sopra della differenza originale, quindi il p-value (che rappresenta quanto spesso un valore nullo è più estremo) si calcola contando il numero di valori nulli che sono less della differenza originale.
Questo esercizio fa parte del corso
Fondamenti di inferenza in R
Istruzioni dell'esercizio
- Per prima cosa,
visualizela distribuzione campionaria delle statistiche permutate indicando la posizione doveobs_stat = diff_orig, e colora i valori inferiori con il comandodirection = "less". - Poi
get_p_valueviene calcolato come la proporzione di statistiche permutate che sonodirection = "less"rispetto aobs_stat = diff_orig. - Come modo alternativo per calcolare il p-value, usa
summarize()emean()per trovare la proporzione di volte in cui le differenze permutate inopp_perm(chiamatestat) sono minori o uguali alla differenza osservata (chiamatadiff_orig). - Puoi mettere alla prova ciò che hai imparato provando:
direction = "greater",direction = "two_sided"edirection = "less"prima di inviare la tua risposta sia avisualizesia aget_p_value.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Visualize the statistic
opp_perm %>%
___(___, ___)
# Calculate the p-value using `get_p_value`
opp_perm %>%
___(___, ___)
# Calculate the p-value using `summarize`
opp_perm %>%
summarize(p_value = ___)