Kreditnehmer-Region nach Jahr
In dieser Übung wirst du die Daten nach Jahr und der Variable msa (Stadt vs. ländlich) tabellieren.
Diese Übung ist Teil des Kurses
Skalierbare Datenverarbeitung in R
Anleitung zur Übung
Alle benötigten Pakete sind in deinem Workspace geladen.
- Erstelle eine Funktion
make_table(), die einen Chunk als Matrix einliest und ihn dann nach Kreditnehmer-Region (msa) und Jahr tabelliert. - Verwende
chunk.apply(), um die Daten aus der von uns für dich eingerichteten Dateiverbindung zu importieren. - Führe den restlichen Code aus, um die Veränderungen der vergebenen Hypotheken nach Region zu visualisieren.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Open a connection to the file and skip the header
fc <- file("mortgage-sample.csv", "rb")
readLines(fc, n = 1)
# Create a function to read chunks
make_table <- function(chunk) {
# Create a matrix
m <- ___(___, sep = ",", type = "integer")
colnames(m) <- mort_names
# Create the output table
___(___, c(___, ___))
}
# Import data using chunk.apply
msa_year_table <- ___
# Close connection
close(fc)
# Convert to a data frame
df_msa <- as.data.frame(msa_year_table)
# Rename columns
df_msa$MSA <- c("rural", "city")
# Gather on all columns except Year
df_msa_long <- pivot_longer(df_msa, -MSA, names_to = "Year", values_to = "Count")
# Plot
ggplot(df_msa_long, aes(x = Year, y = Count, group = MSA, color = MSA)) +
geom_line()