IniziaInizia gratis

Lettura di chunk come matrice

In questo esercizio scriverai una funzione table() scalabile per contare il numero di mutuatari urbani e rurali nel dataset dei mutui usando chunk.apply(). Per impostazione predefinita, chunk.apply() aggrega i dati elaborati usando la funzione rbind(). Questo significa che puoi creare una tabella per ciascun chunk e poi sommare le righe della matrice risultante per ottenere i conteggi totali della tabella.

Abbiamo creato una connessione al file fc verso il file "mortgage-sample.csv" e letto la prima riga per rimuovere l'intestazione.

Questo esercizio fa parte del corso

Elaborazione scalabile dei dati in R

Visualizza il corso

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Define the function to apply to each chunk
make_table <- function(chunk) {
    # Read each chunk as a matrix
    x <- ___(chunk, type = "integer", sep = ",")
    # Create a table of the number of borrowers (column 3) for each chunk
    table(x[, 3])
}
Modifica ed esegui il codice