Aan de slagGa gratis aan de slag

Regio van lener per jaar

In deze oefening ga je de gegevens per jaar en de variabele msa (stad vs. landelijk) in een tabel zetten.

Deze oefening maakt deel uit van de cursus

Schaalbare gegevensverwerking in R

Cursus bekijken

Oefeninstructies

Alle vereiste packages zijn al in je werkomgeving geladen.

  • Maak een functie make_table() die een chunk als matrix inleest en deze vervolgens samenvat per regio van de lener (msa) en per jaar.
  • Gebruik chunk.apply() om de gegevens te importeren uit de bestandsverbinding die we voor je hebben klaargezet.
  • Voer de rest van de code uit om de veranderingen in ontvangen hypotheken per regio te plotten.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Open a connection to the file and skip the header
fc <- file("mortgage-sample.csv", "rb")
readLines(fc, n = 1)

# Create a function to read chunks
make_table <- function(chunk) {
    # Create a matrix
    m <- ___(___, sep = ",", type = "integer")
    colnames(m) <- mort_names
    # Create the output table
    ___(___, c(___, ___))
}

# Import data using chunk.apply
msa_year_table <- ___

# Close connection
close(fc)

# Convert to a data frame
df_msa <- as.data.frame(msa_year_table)

# Rename columns
df_msa$MSA <- c("rural", "city")

# Gather on all columns except Year
df_msa_long <- pivot_longer(df_msa, -MSA, names_to = "Year", values_to = "Count")

# Plot 
ggplot(df_msa_long, aes(x = Year, y = Count, group = MSA, color = MSA)) + 
    geom_line()
Code bewerken en uitvoeren