BaşlayınÜcretsiz Başlayın

CSV ve RDS dosyalarının okuma sürelerini karşılaştırma

En sık yaptığımız işlerden biri, verileri CSV dosyalarından okumaktır. Ancak, büyük CSV dosyalarında bu işlem yavaş olabilir. Güzel bir yöntem, veriyi okuyup bir R ikili dosyası (rds) olarak kaydetmektir; bunun için saveRDS() kullanılır. rds dosyasını okumak için ise readRDS() kullanırız.

Not: rds, tekil nesneleri saklamak için R'nin yerel biçimi olduğundan, gelecekte değişebilecek üçüncü taraf bağımlılıkları eklemiş olmazsın.

İki yaklaşımı kıyaslamak için system.time() kullanabilirsin. Bu fonksiyon, herhangi bir R ifadesinin değerlendirilmesinin ne kadar sürdüğünü döndürür. Örneğin, birden on milyona kadar olan sayıların karekökünü hesaplamanın ne kadar zaman aldığını ölçmek için şöyle yazarsın:

system.time(sqrt(1:1e7))

Bu egzersiz

Verimli R Kodu Yazma

kursunun bir parçasıdır
Kursu Görüntüle

Egzersiz talimatları

"movies.csv" ve "movies.rds" dosyalarının her ikisi de 45.000 filmle ilgili aynı veri çerçevelerini içerir.

  • system.time() fonksiyonunu kullanarak, CSV dosyasını read.csv("movies.csv") ile okumanın ne kadar sürdüğünü ölç.
  • Aynısını readRDS() kullanarak "movies.rds" için tekrarla.

Uygulamalı interaktif egzersiz

Bu örnek kodu tamamlayarak bu egzersizi bitirin.

# How long does it take to read movies from CSV?
system.time(read.csv(___))

# How long does it take to read movies from RDS?
___
Kodu Düzenle ve Çalıştır