CSV ve RDS dosyalarının okuma sürelerini karşılaştırma
En sık yaptığımız işlerden biri, verileri CSV dosyalarından okumaktır. Ancak, büyük CSV dosyalarında bu işlem yavaş olabilir.
Güzel bir yöntem, veriyi okuyup bir R ikili dosyası (rds) olarak kaydetmektir; bunun için saveRDS() kullanılır.
rds dosyasını okumak için ise readRDS() kullanırız.
Not: rds, tekil nesneleri saklamak için R'nin yerel biçimi olduğundan, gelecekte değişebilecek üçüncü taraf bağımlılıkları eklemiş olmazsın.
İki yaklaşımı kıyaslamak için system.time() kullanabilirsin.
Bu fonksiyon, herhangi bir R ifadesinin değerlendirilmesinin ne kadar sürdüğünü döndürür. Örneğin, birden on milyona kadar olan sayıların karekökünü hesaplamanın ne kadar zaman aldığını ölçmek için şöyle yazarsın:
system.time(sqrt(1:1e7))
Bu egzersiz
Verimli R Kodu Yazma
kursunun bir parçasıdırEgzersiz talimatları
"movies.csv" ve "movies.rds" dosyalarının her ikisi de 45.000 filmle ilgili aynı veri çerçevelerini içerir.
system.time()fonksiyonunu kullanarak, CSV dosyasınıread.csv("movies.csv")ile okumanın ne kadar sürdüğünü ölç.- Aynısını
readRDS()kullanarak"movies.rds"için tekrarla.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# How long does it take to read movies from CSV?
system.time(read.csv(___))
# How long does it take to read movies from RDS?
___