LoslegenKostenlos loslegen

Kreditnehmer-Region nach Jahr

In dieser Übung wirst du die Daten nach Jahr und der Variable msa (Stadt vs. ländlich) tabellieren.

Diese Übung ist Teil des Kurses

Skalierbare Datenverarbeitung in R

Kurs anzeigen

Anleitung zur Übung

Alle benötigten Pakete sind in deinem Workspace geladen.

  • Erstelle eine Funktion make_table(), die einen Chunk als Matrix einliest und ihn dann nach Kreditnehmer-Region (msa) und Jahr tabelliert.
  • Verwende chunk.apply(), um die Daten aus der von uns für dich eingerichteten Dateiverbindung zu importieren.
  • Führe den restlichen Code aus, um die Veränderungen der vergebenen Hypotheken nach Region zu visualisieren.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Open a connection to the file and skip the header
fc <- file("mortgage-sample.csv", "rb")
readLines(fc, n = 1)

# Create a function to read chunks
make_table <- function(chunk) {
    # Create a matrix
    m <- ___(___, sep = ",", type = "integer")
    colnames(m) <- mort_names
    # Create the output table
    ___(___, c(___, ___))
}

# Import data using chunk.apply
msa_year_table <- ___

# Close connection
close(fc)

# Convert to a data frame
df_msa <- as.data.frame(msa_year_table)

# Rename columns
df_msa$MSA <- c("rural", "city")

# Gather on all columns except Year
df_msa_long <- pivot_longer(df_msa, -MSA, names_to = "Year", values_to = "Count")

# Plot 
ggplot(df_msa_long, aes(x = Year, y = Count, group = MSA, color = MSA)) + 
    geom_line()
Code bearbeiten und ausführen