Regio van lener per jaar
In deze oefening ga je de gegevens per jaar en de variabele msa (stad vs. landelijk) in een tabel zetten.
Deze oefening maakt deel uit van de cursus
Schaalbare gegevensverwerking in R
Oefeninstructies
Alle vereiste packages zijn al in je werkomgeving geladen.
- Maak een functie
make_table()die een chunk als matrix inleest en deze vervolgens samenvat per regio van de lener (msa) en per jaar. - Gebruik
chunk.apply()om de gegevens te importeren uit de bestandsverbinding die we voor je hebben klaargezet. - Voer de rest van de code uit om de veranderingen in ontvangen hypotheken per regio te plotten.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Open a connection to the file and skip the header
fc <- file("mortgage-sample.csv", "rb")
readLines(fc, n = 1)
# Create a function to read chunks
make_table <- function(chunk) {
# Create a matrix
m <- ___(___, sep = ",", type = "integer")
colnames(m) <- mort_names
# Create the output table
___(___, c(___, ___))
}
# Import data using chunk.apply
msa_year_table <- ___
# Close connection
close(fc)
# Convert to a data frame
df_msa <- as.data.frame(msa_year_table)
# Rename columns
df_msa$MSA <- c("rural", "city")
# Gather on all columns except Year
df_msa_long <- pivot_longer(df_msa, -MSA, names_to = "Year", values_to = "Count")
# Plot
ggplot(df_msa_long, aes(x = Year, y = Count, group = MSA, color = MSA)) +
geom_line()