CommencerCommencer gratuitement

Région de l’emprunteur par année

Dans cet exercice, vous allez établir un tableau des données par année et par variable msa (ville vs rural).

Cet exercice fait partie du cours

Traitement de données à grande échelle en R

Afficher le cours

Instructions

Tous les packages nécessaires sont chargés dans votre espace de travail.

  • Créez une fonction make_table() qui lit un bloc en matrice puis le met en tableau par région de l’emprunteur (msa) et par année.
  • Utilisez chunk.apply() pour importer les données depuis la connexion de fichier que nous avons créée pour vous.
  • Exécutez le reste du code pour tracer l’évolution des prêts hypothécaires par région.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Open a connection to the file and skip the header
fc <- file("mortgage-sample.csv", "rb")
readLines(fc, n = 1)

# Create a function to read chunks
make_table <- function(chunk) {
    # Create a matrix
    m <- ___(___, sep = ",", type = "integer")
    colnames(m) <- mort_names
    # Create the output table
    ___(___, c(___, ___))
}

# Import data using chunk.apply
msa_year_table <- ___

# Close connection
close(fc)

# Convert to a data frame
df_msa <- as.data.frame(msa_year_table)

# Rename columns
df_msa$MSA <- c("rural", "city")

# Gather on all columns except Year
df_msa_long <- pivot_longer(df_msa, -MSA, names_to = "Year", values_to = "Count")

# Plot 
ggplot(df_msa_long, aes(x = Year, y = Count, group = MSA, color = MSA)) + 
    geom_line()
Modifier et exécuter le code