LoslegenKostenlos loslegen

Tidy- und Wide-Daten in tidycensus

Standardmäßig geben tidycensus-Funktionen tidy data frames zurück, in denen jede Zeile eine eindeutige Kombination aus Einheit und Variable darstellt. Manchmal ist es jedoch für bestimmte Visualisierungs- und Analysemethoden nützlich, jede Census-Variable in einer eigenen Spalte zu haben. Das erreichst du, indem du in deinen Aufrufen von get_acs() oder get_decennial() output = "wide" setzt; dadurch werden Schätzer/Werte und Fehlermargen in eigenen Spalten abgelegt.

Diese Übung ist Teil des Kurses

US-Census-Daten in R analysieren

Kurs anzeigen

Anleitung zur Übung

  • Hole ACS-Daten zum Median-Haushaltseinkommen und zum Medianalter für Countys in Oregon im wide-Format, indem du output = "wide" angibst.
  • Prüfe die ersten Zeilen deines Wide-Data-Frames.
  • Erstelle mit der Funktion plot() ein Scatterplot von Median-Haushaltseinkommen und Medianalter.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Return county data in wide format
or_wide <- get_acs(geography = ___, 
                     ___ = "OR",
                     variables = c(hhincome = "B19013_001", 
                            medage = "B01002_001"), 
                     output = ___)

# Compare output to the tidy format from previous exercises
head(___)

# Create a scatterplot
___(or_wide$hhincomeE, or_wide$medageE)
Code bearbeiten und ausführen