Passo dopo passo nella permutazione
Per aiutarti a capire il codice usato per creare la distribuzione di randomizzazione, questo esercizio ti guiderà attraverso i passaggi del framework infer. In particolare, vedrai come le differenze tra i replicati generati influenzano le statistiche calcolate.
Dopo aver eseguito i passaggi di infer, nota che i numeri sono leggermente diversi per ogni replicate.
Questo esercizio fa parte del corso
Fondamenti di inferenza in R
Istruzioni dell'esercizio
I pacchetti dplyr e infer sono già stati caricati, insieme al data frame disc dall'esercizio precedente.
- Chiama le funzioni per i primi tre passaggi. Il lavoro è già stato fatto per te: il tuo compito è esaminare i risultati delle prime tre fasi di
infer. - Per vedere l'effetto della permutazione,
- raggruppa il data frame permutato,
disc_perm, per la nuova variabilereplicate, quindi - conta le variabili di interesse (
promoteall'interno di ciascunsex) usandocount().
- raggruppa il data frame permutato,
- Usando
disc_perm,calculate()la statistica di interesse. Impostastatsu"diff in props"eordersuc("male", "female").
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Replicate the entire data frame, permuting the promote variable
disc_perm <- disc %>%
specify(promote ~ sex, success = "promoted") %>%
hypothesize(null = "independence") %>%
generate(reps = 5, type = "permute")
disc_perm %>%
# Group by replicate
___ %>%
# Count per group
___
disc_perm %>%
# Calculate difference in proportion, male then female
___