MulaiMulai sekarang secara gratis

Membandingkan waktu baca file CSV dan RDS

Salah satu tugas yang paling sering kita lakukan adalah membaca data dari file CSV. Namun, untuk file CSV berukuran besar, proses ini bisa lambat. Salah satu kiat yang efektif adalah membaca data lalu menyimpannya sebagai file biner R (rds) menggunakan saveRDS(). Untuk membaca file rds, kita menggunakan readRDS().

Catatan: Karena rds adalah format asli R untuk menyimpan satu objek, Anda tidak menambahkan ketergantungan pihak ketiga yang dapat berubah di masa mendatang.

Untuk membandingkan kedua pendekatan tersebut, Anda dapat menggunakan system.time(). Fungsi ini mengembalikan waktu yang dibutuhkan untuk mengevaluasi ekspresi R apa pun. Sebagai contoh, untuk mengukur berapa lama waktu yang dibutuhkan untuk menghitung akar kuadrat dari angka satu hingga sepuluh juta, Anda akan menulis kode berikut:

system.time(sqrt(1:1e7))

Latihan ini adalah bagian dari kursus

Menulis Kode R yang Efisien

Lihat Kursus

Petunjuk latihan

File "movies.csv" dan "movies.rds" keduanya berisi data frame yang identik dengan informasi tentang 45.000 film.

  • Dengan fungsi system.time(), berapa lama waktu yang dibutuhkan untuk membaca file CSV menggunakan read.csv("movies.csv").
  • Ulangi untuk file rds, "movies.rds" menggunakan readRDS().

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# How long does it take to read movies from CSV?
system.time(read.csv(___))

# How long does it take to read movies from RDS?
___
Edit dan Jalankan Kode