Lendo chunks como uma matriz
Neste exercício, você vai escrever uma função table() escalável para contar o número de tomadores urbanos e rurais no conjunto de dados de hipotecas usando chunk.apply(). Por padrão, chunk.apply() agrega os dados processados usando a função rbind(). Isso significa que você pode criar uma tabela a partir de cada chunk e depois somar as linhas da matriz resultante para obter as contagens totais da tabela.
Nós criamos uma conexão de arquivo fc para o arquivo "mortgage-sample.csv" e lemos a primeira linha para remover o cabeçalho.
Este exercício faz parte do curso
Processamento de Dados em Escala no R
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Define the function to apply to each chunk
make_table <- function(chunk) {
# Read each chunk as a matrix
x <- ___(chunk, type = "integer", sep = ",")
# Create a table of the number of borrowers (column 3) for each chunk
table(x[, 3])
}