Passo dopo passo nella permutazione

Per aiutarti a capire il codice usato per creare la distribuzione di randomizzazione, questo esercizio ti guiderà attraverso i passaggi del framework infer. In particolare, vedrai come le differenze tra i replicati generati influenzano le statistiche calcolate.

Dopo aver eseguito i passaggi di infer, nota che i numeri sono leggermente diversi per ogni replicate.

Questo esercizio fa parte del corso

Fondamenti di inferenza in R

Visualizza corso

Istruzioni dell'esercizio

I pacchetti dplyr e infer sono già stati caricati, insieme al data frame disc dall'esercizio precedente.

Chiama le funzioni per i primi tre passaggi. Il lavoro è già stato fatto per te: il tuo compito è esaminare i risultati delle prime tre fasi di infer.
Per vedere l'effetto della permutazione,
- raggruppa il data frame permutato, disc_perm, per la nuova variabile replicate, quindi
- conta le variabili di interesse (promote all'interno di ciascun sex) usando count().
Usando disc_perm, calculate() la statistica di interesse. Imposta stat su "diff in props" e order su c("male", "female").

esercizio interattivo pratico

Prova questo esercizio completando questo codice di esempio.

# Replicate the entire data frame, permuting the promote variable
disc_perm <- disc %>%
  specify(promote ~ sex, success = "promoted") %>%
  hypothesize(null = "independence") %>%
  generate(reps = 5, type = "permute")

disc_perm %>%
  # Group by replicate
  ___ %>%
  # Count per group
  ___

disc_perm %>%
  # Calculate difference in proportion, male then female
  ___

Modifica ed esegui il codice