Riepilogo del costo opportunità (2)

Ora che hai creato la distribuzione di randomizzazione, la userai per valutare se la differenza osservata tra proporzioni è coerente con la differenza nulla. Misurerai questa coerenza (o la sua assenza) con un p-value, ovvero la proporzione di differenze permutate minori o uguali alla differenza osservata.

Il dataset permutato e la statistica osservata originale sono disponibili nel tuo workspace rispettivamente come opp_perm e diff_orig.

Usa visualize e get_p_value con le funzioni integrate di infer. Ricorda che le statistiche sotto l'ipotesi nulla si trovano al di sopra della differenza originale, quindi il p-value (che rappresenta quanto spesso un valore nullo è più estremo) si calcola contando il numero di valori nulli che sono less della differenza originale.

Questo esercizio fa parte del corso

Fondamenti di inferenza in R

Visualizza corso

Istruzioni dell'esercizio

Per prima cosa, visualize la distribuzione campionaria delle statistiche permutate indicando la posizione dove obs_stat = diff_orig, e colora i valori inferiori con il comando direction = "less".
Poi get_p_value viene calcolato come la proporzione di statistiche permutate che sono direction = "less" rispetto a obs_stat = diff_orig.
Come modo alternativo per calcolare il p-value, usa summarize() e mean() per trovare la proporzione di volte in cui le differenze permutate in opp_perm (chiamate stat) sono minori o uguali alla differenza osservata (chiamata diff_orig).
Puoi mettere alla prova ciò che hai imparato provando: direction = "greater", direction = "two_sided" e direction = "less" prima di inviare la tua risposta sia a visualize sia a get_p_value.

esercizio interattivo pratico

Prova questo esercizio completando questo codice di esempio.

# Visualize the statistic 
opp_perm %>%
  ___(___, ___)

# Calculate the p-value using `get_p_value`
opp_perm %>%
  ___(___, ___)

# Calculate the p-value using `summarize`
opp_perm %>%
  summarize(p_value = ___)

Modifica ed esegui il codice