Lendo dados brutos e transformando-os em uma estrutura de dados
Como mencionado antes, parte do que torna o iotools rápido é separar a leitura dos dados do disco da conversão desses dados binários em data.frame ou matrix. Os dados, em seu formato binário, são copiados do disco para a memória como objetos raw. Esses objetos raw são então passados para funções otimizadas que os transformam em objetos data.frame ou matrix.
Neste exercício, você vai aprender a separar a leitura dos dados do disco (usando a função readAsRaw()), e depois converter os dados binários raw em matrix ou data.frame (usando as funções mstrsplit() e dstrsplit()).
Este exercício faz parte do curso
Processamento de Dados em Escala no R
Instruções do exercício
- Leia
"mortgage-sample.csv"como um vetor raw. - Converta o conteúdo do vetor raw em uma
matrixde inteiros. - Converta o conteúdo do vetor raw em um
data.framecom 16 colunas inteiras.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Read mortgage-sample.csv as a raw vector
raw_file_content <- ___("mortgage-sample.csv")
# Convert the raw vector contents to a matrix
mort_mat <- ___(___, sep = ",", type = ___, skip = 1)
# Look at the first 6 rows
head(mort_mat)
# Convert the raw file contents to a data.frame
mort_df <- ___(___, sep = ",", col_types = rep("integer", 16), skip = 1)
# Look at the first 6 rows
head(mort_df)