Tidy- und Wide-Daten in tidycensus
Standardmäßig geben tidycensus-Funktionen tidy data frames zurück, in denen jede Zeile eine eindeutige Kombination aus Einheit und Variable darstellt. Manchmal ist es jedoch für bestimmte Visualisierungs- und Analysemethoden nützlich, jede Census-Variable in einer eigenen Spalte zu haben. Das erreichst du, indem du in deinen Aufrufen von get_acs() oder get_decennial() output = "wide" setzt; dadurch werden Schätzer/Werte und Fehlermargen in eigenen Spalten abgelegt.
Diese Übung ist Teil des Kurses
US-Census-Daten in R analysieren
Anleitung zur Übung
- Hole ACS-Daten zum Median-Haushaltseinkommen und zum Medianalter für Countys in Oregon im wide-Format, indem du
output = "wide"angibst. - Prüfe die ersten Zeilen deines Wide-Data-Frames.
- Erstelle mit der Funktion
plot()ein Scatterplot von Median-Haushaltseinkommen und Medianalter.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Return county data in wide format
or_wide <- get_acs(geography = ___,
___ = "OR",
variables = c(hhincome = "B19013_001",
medage = "B01002_001"),
output = ___)
# Compare output to the tidy format from previous exercises
head(___)
# Create a scatterplot
___(or_wide$hhincomeE, or_wide$medageE)