Lire des blocs sous forme de matrice
Dans cet exercice, vous allez écrire une fonction table() évolutive qui compte le nombre d’emprunteurs urbains et ruraux dans l’ensemble de données de prêts hypothécaires en utilisant chunk.apply(). Par défaut, chunk.apply() agrège les données traitées avec la fonction rbind(). Cela signifie que vous pouvez créer un tableau pour chacun des blocs, puis additionner les lignes de la matrice obtenue afin d’obtenir les totaux pour le tableau.
Nous avons créé une connexion de fichier fc vers le fichier "mortgage-sample.csv" et lu la première ligne pour supprimer l’en-tête.
Cet exercice fait partie du cours
Traitement de données à grande échelle en R
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Define the function to apply to each chunk
make_table <- function(chunk) {
# Read each chunk as a matrix
x <- ___(chunk, type = "integer", sep = ",")
# Create a table of the number of borrowers (column 3) for each chunk
table(x[, 3])
}