BaşlayınÜcretsiz başlayın

CSV ve RDS dosyalarının okuma sürelerini karşılaştırma

En sık yaptığımız işlerden biri, verileri CSV dosyalarından okumaktır. Ancak, büyük CSV dosyalarında bu işlem yavaş olabilir. Güzel bir yöntem, veriyi okuyup bir R ikili dosyası (rds) olarak kaydetmektir; bunun için saveRDS() kullanılır. rds dosyasını okumak için ise readRDS() kullanırız.

Not: rds, tekil nesneleri saklamak için R'nin yerel biçimi olduğundan, gelecekte değişebilecek üçüncü taraf bağımlılıkları eklemiş olmazsın.

İki yaklaşımı kıyaslamak için system.time() kullanabilirsin. Bu fonksiyon, herhangi bir R ifadesinin değerlendirilmesinin ne kadar sürdüğünü döndürür. Örneğin, birden on milyona kadar olan sayıların karekökünü hesaplamanın ne kadar zaman aldığını ölçmek için şöyle yazarsın:

system.time(sqrt(1:1e7))

Bu egzersiz, kursun bir parçasıdır

Verimli R Kodu Yazma

Kursa Göz Atın

Egzersiz talimatları

"movies.csv" ve "movies.rds" dosyalarının her ikisi de 45.000 filmle ilgili aynı veri çerçevelerini içerir.

  • system.time() fonksiyonunu kullanarak, CSV dosyasını read.csv("movies.csv") ile okumanın ne kadar sürdüğünü ölç.
  • Aynısını readRDS() kullanarak "movies.rds" için tekrarla.

Uygulamalı etkileşimli egzersiz

Bu egzersizi bu örnek kodu tamamlayarak deneyin.

# How long does it take to read movies from CSV?
system.time(read.csv(___))

# How long does it take to read movies from RDS?
___
Kodu Düzenle ve Çalıştır