Calcolare i p-value

Nel video hai visto che un p-value misura il grado di disaccordo tra i dati e l'ipotesi nulla. Qui calcolerai il p-value per l'insieme di dati originale sulla discriminazione e per le versioni piccola e grande, disc_small e disc_big.

Le differenze originali nelle proporzioni sono disponibili nel tuo workspace, diff_orig, diff_orig_small e diff_orig_big, così come gli insiemi di dati permutati, disc_perm, disc_perm_small e disc_perm_big.

Ricorda che qui ti interessa solo un test d'ipotesi unilaterale. In altre parole, stai cercando di rispondere alla domanda: «Gli uomini hanno più probabilità di essere promossi rispetto alle donne?»

Questo esercizio fa parte del corso

Fondamenti di inferenza in R

Visualizza corso

Istruzioni dell'esercizio

Usa visualize() e get_p_value() con le funzioni integrate di infer. Ricorda che le statistiche sotto l'ipotesi nulla sono al di sotto della differenza originale, quindi il p-value (che rappresenta la frequenza con cui un valore nullo è più estremo) si calcola contando quanti valori nulli sono greater della differenza originale.
Ripeti per il dataset piccolo, disc_perm_small, che ha differenza osservata diff_orig_small.
Ripeti per il dataset grande, disc_perm_big, che ha differenza osservata diff_orig_big.
Puoi mettere alla prova ciò che hai imparato provando: direction = "greater", direction = "two_sided" e direction = "less" prima di Invia risposta.

esercizio interattivo pratico

Prova questo esercizio completando questo codice di esempio.

# Visualize and calculate the p-value for the original dataset
disc_perm %>%
  ___(obs_stat = ___, direction = "___")

disc_perm %>%
  ___(___, ___)

# Visualize and calculate the p-value for the small dataset
___ %>%
  ___(___, ___)

___ %>%
  ___(___, ___)

# Visualize and calculate the p-value for the big dataset
___ %>%
  ___(___, ___)

___ %>%
  ___(___, ___)

Modifica ed esegui il codice