BaşlayınÜcretsiz Başlayın

Atama ve modellemeyi bir fonksiyona sarmalamak

Atama yapılmış veriler üzerinde herhangi bir analiz veya modelleme yaptığında, atamadan kaynaklanan belirsizliği hesaba katmalısın. Sadece bir kez atama yapılmış bir veri kümesi üzerinde model çalıştırmak, atamanın eksik değerleri belirsizlikle tahmin ettiğini göz ardı eder. Böyle bir modelden elde edilen standart hatalar genellikle fazla küçük çıkar. Bunun çözümü çoklu atamadır ve bunu uygulamanın bir yolu bootstrap yöntemidir.

Sıradaki egzersizlerde, aşina olduğun biopics verisiyle çalışacaksın. Amaç, bootstrap ile çoklu atama ve doğrusal regresyon kullanarak, eldeki verilere göre kadınların yer aldığı biyografik filmlerin erkekler hakkındaki filmlere göre daha az kazanıp kazanmadığını görmek.

Hadi, bir bootstrap örneklemi oluşturan, onu atayan ve bir doğrusal regresyon modeli kuran bir fonksiyon yazarak başlayalım.

Bu egzersiz

R'de Atamaya Dayalı Eksik Veri Doldurma

kursunun bir parçasıdır
Kursu Görüntüle

Egzersiz talimatları

  • indices ile belirtilen satırları yeniden örneklemek için datayı dilimle ve sonucu data_boot değişkenine ata.
  • Bootstrap örneklemi data_boot üzerinde 5 komşulu kNN ataması yap ve sonucu data_imp değişkenine ata.
  • earnings değişkenini sub_sex, sub_type ve year ile açıklayan bir doğrusal regresyon modelini data_imp üzerinde kur.

Uygulamalı interaktif egzersiz

Bu örnek kodu tamamlayarak bu egzersizi bitirin.

calc_gender_coef <- function(data, indices) {
  # Get bootstrap sample
  data_boot <- data[___, ]
  # Impute with kNN imputation
  data_imp <- ___
  # Fit linear regression
  linear_model <- ___
  # Extract and return gender coefficient
  gender_coefficient <- coef(linear_model)[2]
  return(gender_coefficient)
}
Kodu Düzenle ve Çalıştır