IniziaInizia gratis

Lettura di dati raw e conversione in una struttura dati

Come accennato, parte della velocità di iotools deriva dal fatto che separa la lettura dei dati dal disco dalla conversione dei dati binari in un data.frame o una matrix. I dati nel loro formato binario vengono copiati dal disco in memoria come oggetti raw. Questi oggetti raw vengono poi passati a funzioni ottimizzate che li trasformano in oggetti data.frame o matrix.

In questo esercizio imparerai a separare la lettura dei dati dal disco (usando la funzione readAsRaw()), e poi a convertire i dati binari raw in una matrix o in un data.frame (usando le funzioni mstrsplit() e dstrsplit()).

Questo esercizio fa parte del corso

Elaborazione scalabile dei dati in R

Visualizza il corso

Istruzioni dell'esercizio

  • Leggi "mortgage-sample.csv" come vettore raw.
  • Converti il contenuto del vettore raw in una matrix di interi.
  • Converti il contenuto del vettore raw in un data.frame con 16 colonne intere.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Read mortgage-sample.csv as a raw vector
raw_file_content <- ___("mortgage-sample.csv")

# Convert the raw vector contents to a matrix
mort_mat <- ___(___, sep = ",", type = ___, skip = 1)

# Look at the first 6 rows
head(mort_mat)

# Convert the raw file contents to a data.frame
mort_df <- ___(___, sep = ",", col_types = rep("integer", 16), skip = 1)

# Look at the first 6 rows
head(mort_df)
Modifica ed esegui il codice