Comece agoraComece grátis

Lendo dados brutos e transformando-os em uma estrutura de dados

Como mencionado antes, parte do que torna o iotools rápido é separar a leitura dos dados do disco da conversão desses dados binários em data.frame ou matrix. Os dados, em seu formato binário, são copiados do disco para a memória como objetos raw. Esses objetos raw são então passados para funções otimizadas que os transformam em objetos data.frame ou matrix.

Neste exercício, você vai aprender a separar a leitura dos dados do disco (usando a função readAsRaw()), e depois converter os dados binários raw em matrix ou data.frame (usando as funções mstrsplit() e dstrsplit()).

Este exercicio faz parte do curso

Processamento de Dados em Escala no R

Ver curso

Instruções do exercicio

  • Leia "mortgage-sample.csv" como um vetor raw.
  • Converta o conteúdo do vetor raw em uma matrix de inteiros.
  • Converta o conteúdo do vetor raw em um data.frame com 16 colunas inteiras.

exercicio interativo prático

Tente este exercicio completando este código de exemplo.

# Read mortgage-sample.csv as a raw vector
raw_file_content <- ___("mortgage-sample.csv")

# Convert the raw vector contents to a matrix
mort_mat <- ___(___, sep = ",", type = ___, skip = 1)

# Look at the first 6 rows
head(mort_mat)

# Convert the raw file contents to a data.frame
mort_df <- ___(___, sep = ",", col_types = rep("integer", 16), skip = 1)

# Look at the first 6 rows
head(mort_df)
Editar e Executar Código