Région de l’emprunteur par année
Dans cet exercice, vous allez établir un tableau des données par année et par variable msa (ville vs rural).
Cet exercice fait partie du cours
Traitement de données à grande échelle en R
Instructions
Tous les packages nécessaires sont chargés dans votre espace de travail.
- Créez une fonction
make_table()qui lit un bloc en matrice puis le met en tableau par région de l’emprunteur (msa) et par année. - Utilisez
chunk.apply()pour importer les données depuis la connexion de fichier que nous avons créée pour vous. - Exécutez le reste du code pour tracer l’évolution des prêts hypothécaires par région.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Open a connection to the file and skip the header
fc <- file("mortgage-sample.csv", "rb")
readLines(fc, n = 1)
# Create a function to read chunks
make_table <- function(chunk) {
# Create a matrix
m <- ___(___, sep = ",", type = "integer")
colnames(m) <- mort_names
# Create the output table
___(___, c(___, ___))
}
# Import data using chunk.apply
msa_year_table <- ___
# Close connection
close(fc)
# Convert to a data frame
df_msa <- as.data.frame(msa_year_table)
# Rename columns
df_msa$MSA <- c("rural", "city")
# Gather on all columns except Year
df_msa_long <- pivot_longer(df_msa, -MSA, names_to = "Year", values_to = "Count")
# Plot
ggplot(df_msa_long, aes(x = Year, y = Count, group = MSA, color = MSA)) +
geom_line()