ComeçarComece de graça

Lendo chunks como uma matriz

Neste exercício, você vai escrever uma função table() escalável para contar o número de tomadores urbanos e rurais no conjunto de dados de hipotecas usando chunk.apply(). Por padrão, chunk.apply() agrega os dados processados usando a função rbind(). Isso significa que você pode criar uma tabela a partir de cada chunk e depois somar as linhas da matriz resultante para obter as contagens totais da tabela.

Nós criamos uma conexão de arquivo fc para o arquivo "mortgage-sample.csv" e lemos a primeira linha para remover o cabeçalho.

Este exercício faz parte do curso

Processamento de Dados em Escala no R

Ver curso

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Define the function to apply to each chunk
make_table <- function(chunk) {
    # Read each chunk as a matrix
    x <- ___(chunk, type = "integer", sep = ",")
    # Create a table of the number of borrowers (column 3) for each chunk
    table(x[, 3])
}
Editar e executar o código