IniziaInizia gratis

Riepilogare la discriminazione di genere

Come primo passo di qualsiasi analisi, dovresti osservare e riassumere i dati. Le variabili categoriali sono spesso riassunte usando proporzioni, ed è sempre importante capire il denominatore della proporzione.

Vuoi la proporzione di donne che sono state promosse o la proporzione di persone promosse che erano donne? Qui ti serve la prima, quindi nel tuo codice R è necessario usare group_by() sulla variabile sex.

I dati dello studio sulla discriminazione sono disponibili nel tuo workspace come disc.

Questo esercizio fa parte del corso

Fondamenti di inferenza in R

Visualizza il corso

Istruzioni dell'esercizio

  • Usando la funzione count() di dplyr, tabula le variabili sex e promote.
  • Riassumi i dati usando group_by() sulla variabile sex.
  • Trova la proporzione di chi è stato promosso. Chiama questa variabile promoted_prop. Nota che, con variabili binarie, la proporzione di uno dei due valori può essere calcolata con la funzione mean() (ad es. mean(variable == "value")).

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Create a contingency table summarizing the data
disc %>%
  # Count the rows by sex, promote
  ___

# Find proportion of each sex who were promoted
disc %>%
  # Group by sex
  ___
  # Calculate proportion promoted summary stat
  ___
Modifica ed esegui il codice