Membaca data raw dan mengubahnya menjadi struktur data
Seperti disebutkan sebelumnya, salah satu hal yang membuat iotools cepat adalah pemisahan proses membaca data dari hard drive dengan proses mengonversi data biner tersebut menjadi data.frame atau matrix. Data dalam format binernya disalin dari hard drive ke memori sebagai objek raw. Objek raw ini kemudian diteruskan ke fungsi-fungsi teroptimasi yang mengubahnya menjadi objek data.frame atau matrix.
Dalam latihan ini, Anda akan mempelajari cara memisahkan proses membaca data dari disk (menggunakan fungsi readAsRaw()), lalu mengonversi data biner raw menjadi matrix atau data.frame (menggunakan fungsi mstrsplit() dan dstrsplit()).
Latihan ini merupakan bagian dari kursus
Pemrosesan Data yang Dapat Diskalakan di R
Instruksi latihan
- Baca
"mortgage-sample.csv"sebagai vektor raw. - Konversikan isi vektor raw menjadi
matrixbertipe integer. - Konversikan isi vektor raw menjadi
data.framedengan 16 kolom bertipe integer.
Latihan interaktif langsung praktik
Cobalah latihan ini dengan melengkapi kode contoh ini.
# Read mortgage-sample.csv as a raw vector
raw_file_content <- ___("mortgage-sample.csv")
# Convert the raw vector contents to a matrix
mort_mat <- ___(___, sep = ",", type = ___, skip = 1)
# Look at the first 6 rows
head(mort_mat)
# Convert the raw file contents to a data.frame
mort_df <- ___(___, sep = ",", col_types = rep("integer", 16), skip = 1)
# Look at the first 6 rows
head(mort_df)