BaşlayınÜcretsiz Başlayın

Rastgele ormanlarla imputasyon

İmputasyona yönelik bir Machine Learning yaklaşımı, geleneksel istatistiksel modellere kıyasla hem daha doğru hem de uygulaması daha kolay olabilir. Öncelikle, değişkenler arasındaki ilişkileri önceden belirtmeni gerektirmez. Ayrıca, rastgele ormanlar gibi Machine Learning modelleri son derece karmaşık, doğrusal olmayan ilişkileri keşfedip bunlardan yararlanarak eksik değerleri tahmin edebilir.

Bu egzersizde, her bir değişken için tek tek eksik değerleri tahmin etmek üzere ayrı bir rastgele orman kuran missForest paketiyle tanışacaksın. Kursun önceki kısımlarında çalıştığın biyografik filmler verisi biopics üzerinde bu imputasyon fonksiyonunu çağıracak, ardından hem doldurulmuş veriyi hem de tahmini imputasyon hatalarını çıkaracaksın.

Haydi birkaç rastgele orman dikelim!

Bu egzersiz

R'de Atamaya Dayalı Eksik Veri Doldurma

kursunun bir parçasıdır
Kursu Görüntüle

Egzersiz talimatları

  • missForest paketini yükle.
  • missForest() ile biopics verisindeki eksik değerleri imputasyon yap; sonucu imp_res değişkenine ata.
  • imp_res içinden doldurulmuş veri kümesini çıkar, imp_data değişkenine ata ve eksik değer sayısının gerçekten sıfır olup olmadığını kontrol et.
  • imp_res içinden tahmini imputasyon hatasını çıkar, imp_err değişkenine ata ve konsola yazdır.

Uygulamalı interaktif egzersiz

Bu örnek kodu tamamlayarak bu egzersizi bitirin.

# Load the missForest package
___

# Impute biopics data using missForest
imp_res <- ___(___)

# Extract imputed data and check for missing values
imp_data <- imp_res$___
print(___(___(___)))

# Extract and print imputation errors
imp_err <- imp_res$___
print(___)
Kodu Düzenle ve Çalıştır