Trouver le groupe le plus important par comté
Les outils de manipulation de données du tidyverse, dans des packages comme dplyr et purrr, sont extrêmement puissants pour explorer les données du Census. tidycensus est spécialement conçu pour l’exploration de données dans l’écosystème tidyverse. Par exemple, vous pourriez vouloir identifier le groupe racial/ethnique le plus important dans chaque comté d’un État donné. Cela peut se faire grâce aux fonctionnalités de groupement de dplyr, qui permettent d’identifier l’estimation ACS la plus élevée d’un groupe et de filtrer pour ne conserver que les lignes correspondant à ce groupe.
Cet exercice fait partie du cours
Analyser les données du recensement américain avec R
Instructions
- Regroupez le jeu de données
ca_racepar la colonneGEOID. - Filtrez le jeu de données pour ne conserver que les lignes où la valeur
estimateest égale au maximum de son groupe (le comté). - Utilisez la fonction
tally()pour déterminer la répartition des plus grands groupes raciaux/ethniques dans les comtés de Californie.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Group the dataset and filter the estimate
ca_largest <- ___ %>%
group_by(___) %>%
filter(___ == max(estimate))
head(ca_largest)
# Group the dataset and get a breakdown of the results
ca_largest %>%
___(___) %>%
___()