Membandingkan waktu baca file CSV dan RDS
Salah satu tugas yang paling sering kita lakukan adalah membaca data dari file CSV. Namun, untuk file CSV berukuran besar, proses ini bisa lambat.
Salah satu kiat yang efektif adalah membaca data lalu menyimpannya sebagai file biner R (rds) menggunakan saveRDS().
Untuk membaca file rds, kita menggunakan readRDS().
Catatan: Karena rds adalah format asli R untuk menyimpan satu objek, Anda tidak menambahkan ketergantungan pihak ketiga yang dapat berubah di masa mendatang.
Untuk membandingkan kedua pendekatan tersebut, Anda dapat menggunakan system.time().
Fungsi ini mengembalikan waktu yang dibutuhkan untuk mengevaluasi ekspresi R apa pun. Sebagai contoh, untuk mengukur berapa lama waktu yang dibutuhkan untuk menghitung akar kuadrat dari angka satu hingga sepuluh juta, Anda akan menulis kode berikut:
system.time(sqrt(1:1e7))
Latihan ini adalah bagian dari kursus
Menulis Kode R yang Efisien
Petunjuk latihan
File "movies.csv" dan "movies.rds" keduanya berisi data frame yang identik dengan informasi tentang 45.000 film.
- Dengan fungsi
system.time(), berapa lama waktu yang dibutuhkan untuk membaca file CSV menggunakanread.csv("movies.csv"). - Ulangi untuk file rds,
"movies.rds"menggunakanreadRDS().
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# How long does it take to read movies from CSV?
system.time(read.csv(___))
# How long does it take to read movies from RDS?
___