CommencerCommencer gratuitement

Données tidy et wide dans tidycensus

Par défaut, les fonctions de tidycensus renvoient des data frames tidy, où chaque ligne correspond à une combinaison unique unité–variable. Cependant, il est parfois utile d’avoir chaque variable du Census dans sa propre colonne pour certains types de visualisation et d’analyse. Pour cela, vous pouvez définir output = "wide" dans vos appels à get_acs() ou get_decennial(), ce qui placera les estimations/valeurs et les marges d’erreur dans leurs propres colonnes.

Cet exercice fait partie du cours

Analyser les données du recensement américain avec R

Afficher le cours

Instructions

  • Récupérez, pour les comtés de l’Oregon, les données ACS sur le revenu médian des ménages et l’âge médian au format wide en précisant output = "wide".
  • Consultez les premières lignes de votre data frame au format wide.
  • Créez un nuage de points du revenu médian des ménages et de l’âge médian avec la fonction plot().

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Return county data in wide format
or_wide <- get_acs(geography = ___, 
                     ___ = "OR",
                     variables = c(hhincome = "B19013_001", 
                            medage = "B01002_001"), 
                     output = ___)

# Compare output to the tidy format from previous exercises
head(___)

# Create a scatterplot
___(or_wide$hhincomeE, or_wide$medageE)
Modifier et exécuter le code