Riepilogare la discriminazione di genere
Come primo passo di qualsiasi analisi, dovresti osservare e riassumere i dati. Le variabili categoriali sono spesso riassunte usando proporzioni, ed è sempre importante capire il denominatore della proporzione.
Vuoi la proporzione di donne che sono state promosse o la proporzione di persone promosse che erano donne? Qui ti serve la prima, quindi nel tuo codice R è necessario usare group_by() sulla variabile sex.
I dati dello studio sulla discriminazione sono disponibili nel tuo workspace come disc.
Questo esercizio fa parte del corso
Fondamenti di inferenza in R
Istruzioni dell'esercizio
- Usando la funzione
count()didplyr, tabula le variabilisexepromote. - Riassumi i dati usando
group_by()sulla variabilesex. - Trova la proporzione di chi è stato promosso. Chiama questa variabile
promoted_prop. Nota che, con variabili binarie, la proporzione di uno dei due valori può essere calcolata con la funzionemean()(ad es.mean(variable == "value")).
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Create a contingency table summarizing the data
disc %>%
# Count the rows by sex, promote
___
# Find proportion of each sex who were promoted
disc %>%
# Group by sex
___
# Calculate proportion promoted summary stat
___