ComeçarComece de graça

Lendo dados brutos e transformando-os em uma estrutura de dados

Como mencionado antes, parte do que torna o iotools rápido é separar a leitura dos dados do disco da conversão desses dados binários em data.frame ou matrix. Os dados, em seu formato binário, são copiados do disco para a memória como objetos raw. Esses objetos raw são então passados para funções otimizadas que os transformam em objetos data.frame ou matrix.

Neste exercício, você vai aprender a separar a leitura dos dados do disco (usando a função readAsRaw()), e depois converter os dados binários raw em matrix ou data.frame (usando as funções mstrsplit() e dstrsplit()).

Este exercício faz parte do curso

Processamento de Dados em Escala no R

Ver curso

Instruções do exercício

  • Leia "mortgage-sample.csv" como um vetor raw.
  • Converta o conteúdo do vetor raw em uma matrix de inteiros.
  • Converta o conteúdo do vetor raw em um data.frame com 16 colunas inteiras.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Read mortgage-sample.csv as a raw vector
raw_file_content <- ___("mortgage-sample.csv")

# Convert the raw vector contents to a matrix
mort_mat <- ___(___, sep = ",", type = ___, skip = 1)

# Look at the first 6 rows
head(mort_mat)

# Convert the raw file contents to a data.frame
mort_df <- ___(___, sep = ",", col_types = rep("integer", 16), skip = 1)

# Look at the first 6 rows
head(mort_df)
Editar e executar o código