Aan de slagBegin gratis

Chunks inlezen als een matrix

In deze oefening ga je een schaalbare table()-functie schrijven die met chunk.apply() het aantal stedelijke en landelijke leners in de hypotheekgegevens telt. Standaard voegt chunk.apply() de verwerkte data samen met de functie rbind(). Dit betekent dat je voor elke chunk een tabel kunt maken en daarna de rijen van de resulterende matrix kunt optellen om de totale tellingen voor de tabel te krijgen.

We hebben een bestandsverbinding fc gemaakt met het bestand "mortgage-sample.csv" en de eerste regel ingelezen om de header te verwijderen.

Deze oefening maakt deel uit van de cursus

Schaalbare gegevensverwerking in R

Bekijk cursus

Interactieve oefening met praktijkervaring

Probeer deze oefening door deze voorbeeldcode aan te vullen.

# Define the function to apply to each chunk
make_table <- function(chunk) {
    # Read each chunk as a matrix
    x <- ___(chunk, type = "integer", sep = ",")
    # Create a table of the number of borrowers (column 3) for each chunk
    table(x[, 3])
}
Code bewerken en uitvoeren