Membaca data raw dan mengubahnya menjadi struktur data
Seperti disebutkan sebelumnya, salah satu hal yang membuat iotools cepat adalah pemisahan proses membaca data dari hard drive dengan proses mengonversi data biner tersebut menjadi data.frame atau matrix. Data dalam format binernya disalin dari hard drive ke memori sebagai objek raw. Objek raw ini kemudian diteruskan ke fungsi-fungsi teroptimasi yang mengubahnya menjadi objek data.frame atau matrix.
Dalam latihan ini, Anda akan mempelajari cara memisahkan proses membaca data dari disk (menggunakan fungsi readAsRaw()), lalu mengonversi data biner raw menjadi matrix atau data.frame (menggunakan fungsi mstrsplit() dan dstrsplit()).
Latihan ini adalah bagian dari kursus
Pemrosesan Data yang Dapat Diskalakan di R
Petunjuk latihan
- Baca
"mortgage-sample.csv"sebagai vektor raw. - Konversikan isi vektor raw menjadi
matrixbertipe integer. - Konversikan isi vektor raw menjadi
data.framedengan 16 kolom bertipe integer.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Read mortgage-sample.csv as a raw vector
raw_file_content <- ___("mortgage-sample.csv")
# Convert the raw vector contents to a matrix
mort_mat <- ___(___, sep = ",", type = ___, skip = 1)
# Look at the first 6 rows
head(mort_mat)
# Convert the raw file contents to a data.frame
mort_df <- ___(___, sep = ",", col_types = rep("integer", 16), skip = 1)
# Look at the first 6 rows
head(mort_df)