Lire des données brutes et les transformer en structure de données
Comme indiqué précédemment, une partie de la rapidité d’iotools vient du fait qu’il sépare la lecture des données depuis le disque de la conversion de ces données binaires en data.frame ou matrix. Les données, dans leur format binaire, sont copiées du disque vers la mémoire sous forme d’objets raw. Ces objets raw sont ensuite transmis à des fonctions optimisées qui les transforment en objets data.frame ou matrix.
Dans cet exercice, vous allez apprendre à séparer la lecture des données depuis le disque (avec la fonction readAsRaw()), puis à convertir les données binaires raw en matrix ou en data.frame (avec les fonctions mstrsplit() et dstrsplit()).
Cet exercice fait partie du cours
Traitement de données à grande échelle en R
Instructions
- Lisez
"mortgage-sample.csv"sous forme de vecteur brut (raw). - Convertissez le contenu du vecteur brut en
matrixd’entiers. - Convertissez le contenu du vecteur brut en
data.frameavec 16 colonnes de type entier.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Read mortgage-sample.csv as a raw vector
raw_file_content <- ___("mortgage-sample.csv")
# Convert the raw vector contents to a matrix
mort_mat <- ___(___, sep = ",", type = ___, skip = 1)
# Look at the first 6 rows
head(mort_mat)
# Convert the raw file contents to a data.frame
mort_df <- ___(___, sep = ",", col_types = rep("integer", 16), skip = 1)
# Look at the first 6 rows
head(mort_df)