Données tidy et wide dans tidycensus
Par défaut, les fonctions de tidycensus renvoient des data frames tidy, où chaque ligne correspond à une combinaison unique unité–variable. Cependant, il est parfois utile d’avoir chaque variable du Census dans sa propre colonne pour certains types de visualisation et d’analyse. Pour cela, vous pouvez définir output = "wide" dans vos appels à get_acs() ou get_decennial(), ce qui placera les estimations/valeurs et les marges d’erreur dans leurs propres colonnes.
Cet exercice fait partie du cours
Analyser les données du recensement américain avec R
Instructions
- Récupérez, pour les comtés de l’Oregon, les données ACS sur le revenu médian des ménages et l’âge médian au format wide en précisant
output = "wide". - Consultez les premières lignes de votre data frame au format wide.
- Créez un nuage de points du revenu médian des ménages et de l’âge médian avec la fonction
plot().
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Return county data in wide format
or_wide <- get_acs(geography = ___,
___ = "OR",
variables = c(hhincome = "B19013_001",
medage = "B01002_001"),
output = ___)
# Compare output to the tidy format from previous exercises
head(___)
# Create a scatterplot
___(or_wide$hhincomeE, or_wide$medageE)