Trouver le groupe le plus important par comté

Les outils de manipulation de données du tidyverse, dans des packages comme dplyr et purrr, sont extrêmement puissants pour explorer les données du Census. tidycensus est spécialement conçu pour l’exploration de données dans l’écosystème tidyverse. Par exemple, vous pourriez vouloir identifier le groupe racial/ethnique le plus important dans chaque comté d’un État donné. Cela peut se faire grâce aux fonctionnalités de groupement de dplyr, qui permettent d’identifier l’estimation ACS la plus élevée d’un groupe et de filtrer pour ne conserver que les lignes correspondant à ce groupe.

Cet exercice fait partie du cours

<cours>Analyser les données du recensement américain avec R</cours>

Voir le cours

Instructions de l’exercice

Regroupez le jeu de données ca_race par la colonne GEOID.
Filtrez le jeu de données pour ne conserver que les lignes où la valeur estimate est égale au maximum de son groupe (le comté).
Utilisez la fonction tally() pour déterminer la répartition des plus grands groupes raciaux/ethniques dans les comtés de Californie.

Exercice interactif pratique

Essayez cet exercice en complétant ce code d’exemple.

# Group the dataset and filter the estimate
ca_largest <- ___ %>%
  group_by(___) %>%
  filter(___ == max(estimate)) 

head(ca_largest)

# Group the dataset and get a breakdown of the results
ca_largest %>% 
  ___(___) %>%
  ___()

Modifier et exécuter le code