Origine ethnique et race des emprunteurs par année (II)
Dans cet exercice, vous allez utiliser iotools et bigtabulate pour établir un tableau de la race et de l’origine ethnique des emprunteurs par année.
Cet exercice fait partie du cours
Traitement de données à grande échelle en R
Instructions
iotools et bigtabulate sont chargés dans votre espace de travail.
- Créez une fonction
make_table()qui lit un bloc en tant que matrice puis l’agrège par race de l’emprunteur et par année. - Utilisez
chunk.apply()pour importer les données depuis la connexion fichier que nous avons créée pour vous. - Convertissez
race_year_tableen data frame.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Open a connection to the file and skip the header
fc <- file("mortgage-sample.csv", "rb")
readLines(fc, n = 1)
# Create a function to read chunks
make_table <- function(chunk) {
# Create a matrix
m <- ___(chunk, sep = ",", type = "integer")
colnames(m) <- mort_names
# Create the output table
___(m, c("borrower_race", "year"))
}
# Import data using chunk.apply
race_year_table <- ___(fc, make_table)
# Close connection
close(fc)
# Cast it to a data frame
rydf <- ___(race_year_table)
# Create a new column Race with race/ethnicity
rydf$Race <- race_cat