Konfidenzintervalle prüfen
ACS-Daten unterscheiden sich von Daten aus der Volkszählung (decennial Census) dadurch, dass sie Schätzungen mit einem zugehörigen Fehlerspielraum (margin of error) darstellen. Standardmäßig beziehen sich ACS-Fehlerspielräume auf ein Konfidenzniveau von 90 Prozent um eine Schätzung herum. Das bedeutet, dass wir mit 90 Prozent Sicherheit davon ausgehen, dass der wahre Wert innerhalb des Bereichs aus der gemeldeten Schätzung plus/minus dem gemeldeten Fehlerspielraum liegt.
In dieser Übung sammelst du Erfahrung im Umgang mit Daten, deren Fehlerspielräume im Verhältnis zu ihren Schätzungen groß sind. Wir verwenden das Beispiel „Armut in der Bevölkerung ab 75 Jahren“ für Census Tracts in Vermont.
Diese Übung ist Teil des Kurses
US-Census-Daten in R analysieren
Anleitung zur Übung
- Hole dir aus der ACS einen Datensatz zur Altersarmut nach Census Tract in Vermont.
- Filtere den Data Frame, um einen neuen Data Frame zu erzeugen, der nur die Zeilen enthält, deren Fehlerspielraum größer ist als ihre Schätzung.
- Teile die Anzahl der Zeilen in
moe_checkdurch die Anzahl der Zeilen im ursprünglichen Datensatz, um den Anteil der Zeilen zu ermitteln, deren Fehlerspielräume größer sind als ihre Schätzungen.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Get data on elderly poverty by Census tract in Vermont
vt_eldpov <- ___(___ = "tract",
variables = c(eldpovm = "B17001_016",
eldpovf = "B17001_030"),
state = "VT")
vt_eldpov
# Identify rows with greater margins of error than their estimates
moe_check <- ___(vt_eldpov, moe > ___)
# Check proportion of rows where the margin of error exceeds the estimate
___(moe_check) / nrow(vt_eldpov)