Aan de slagGa gratis aan de slag

Chunks inlezen als een matrix

In deze oefening ga je een schaalbare table()-functie schrijven die met chunk.apply() het aantal stedelijke en landelijke leners in de hypotheekgegevens telt. Standaard voegt chunk.apply() de verwerkte data samen met de functie rbind(). Dit betekent dat je voor elke chunk een tabel kunt maken en daarna de rijen van de resulterende matrix kunt optellen om de totale tellingen voor de tabel te krijgen.

We hebben een bestandsverbinding fc gemaakt met het bestand "mortgage-sample.csv" en de eerste regel ingelezen om de header te verwijderen.

Deze oefening maakt deel uit van de cursus

Schaalbare gegevensverwerking in R

Cursus bekijken

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Define the function to apply to each chunk
make_table <- function(chunk) {
    # Read each chunk as a matrix
    x <- ___(chunk, type = "integer", sep = ",")
    # Create a table of the number of borrowers (column 3) for each chunk
    table(x[, 3])
}
Code bewerken en uitvoeren