CommencerCommencez gratuitement

Région de l’emprunteur par année

Dans cet exercice, vous allez établir un tableau des données par année et par variable msa (ville vs rural).

Cet exercice fait partie du cours

<cours>Traitement de données à grande échelle en R</cours>
Voir le cours

Instructions de l’exercice

Tous les packages nécessaires sont chargés dans votre espace de travail.

  • Créez une fonction make_table() qui lit un bloc en matrice puis le met en tableau par région de l’emprunteur (msa) et par année.
  • Utilisez chunk.apply() pour importer les données depuis la connexion de fichier que nous avons créée pour vous.
  • Exécutez le reste du code pour tracer l’évolution des prêts hypothécaires par région.

Exercice interactif pratique

Essayez cet exercice en complétant ce code d’exemple.

# Open a connection to the file and skip the header
fc <- file("mortgage-sample.csv", "rb")
readLines(fc, n = 1)

# Create a function to read chunks
make_table <- function(chunk) {
    # Create a matrix
    m <- ___(___, sep = ",", type = "integer")
    colnames(m) <- mort_names
    # Create the output table
    ___(___, c(___, ___))
}

# Import data using chunk.apply
msa_year_table <- ___

# Close connection
close(fc)

# Convert to a data frame
df_msa <- as.data.frame(msa_year_table)

# Rename columns
df_msa$MSA <- c("rural", "city")

# Gather on all columns except Year
df_msa_long <- pivot_longer(df_msa, -MSA, names_to = "Year", values_to = "Count")

# Plot 
ggplot(df_msa_long, aes(x = Year, y = Count, group = MSA, color = MSA)) + 
    geom_line()
Modifier et exécuter le code