Calcolare i p-value
Nel video hai visto che un p-value misura il grado di disaccordo tra i dati e l'ipotesi nulla. Qui calcolerai il p-value per l'insieme di dati originale sulla discriminazione e per le versioni piccola e grande, disc_small e disc_big.
Le differenze originali nelle proporzioni sono disponibili nel tuo workspace, diff_orig, diff_orig_small e diff_orig_big, così come gli insiemi di dati permutati, disc_perm, disc_perm_small e disc_perm_big.
Ricorda che qui ti interessa solo un test d'ipotesi unilaterale. In altre parole, stai cercando di rispondere alla domanda: «Gli uomini hanno più probabilità di essere promossi rispetto alle donne?»
Questo esercizio fa parte del corso
Fondamenti di inferenza in R
Istruzioni dell'esercizio
- Usa
visualize()eget_p_value()con le funzioni integrate diinfer. Ricorda che le statistiche sotto l'ipotesi nulla sono al di sotto della differenza originale, quindi il p-value (che rappresenta la frequenza con cui un valore nullo è più estremo) si calcola contando quanti valori nulli sonogreaterdella differenza originale. - Ripeti per il dataset piccolo,
disc_perm_small, che ha differenza osservatadiff_orig_small. - Ripeti per il dataset grande,
disc_perm_big, che ha differenza osservatadiff_orig_big. - Puoi mettere alla prova ciò che hai imparato provando:
direction = "greater",direction = "two_sided"edirection = "less"prima di Invia risposta.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Visualize and calculate the p-value for the original dataset
disc_perm %>%
___(obs_stat = ___, direction = "___")
disc_perm %>%
___(___, ___)
# Visualize and calculate the p-value for the small dataset
___ %>%
___(___, ___)
___ %>%
___(___, ___)
# Visualize and calculate the p-value for the big dataset
___ %>%
___(___, ___)
___ %>%
___(___, ___)