Chunks inlezen als een matrix
In deze oefening ga je een schaalbare table()-functie schrijven die met chunk.apply() het aantal stedelijke en landelijke leners in de hypotheekgegevens telt. Standaard voegt chunk.apply() de verwerkte data samen met de functie rbind(). Dit betekent dat je voor elke chunk een tabel kunt maken en daarna de rijen van de resulterende matrix kunt optellen om de totale tellingen voor de tabel te krijgen.
We hebben een bestandsverbinding fc gemaakt met het bestand "mortgage-sample.csv" en de eerste regel ingelezen om de header te verwijderen.
Deze oefening maakt deel uit van de cursus
Schaalbare gegevensverwerking in R
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Define the function to apply to each chunk
make_table <- function(chunk) {
# Read each chunk as a matrix
x <- ___(chunk, type = "integer", sep = ",")
# Create a table of the number of borrowers (column 3) for each chunk
table(x[, 3])
}