Varsayılan modelleri seçmek
MICE, verideki her değişken için ayrı bir atama (imputation) modeli oluşturur. Hangi tür modelin kullanılacağı, ilgili değişkenin tipine bağlıdır. Kullanmak istediğimiz model türlerini belirtmenin yaygın bir yolu, dört değişken tipi için birer varsayılan model ayarlamaktır.
Bunu mice() fonksiyonuna defaultMethod argümanını vererek yapabilirsin; bu argüman şu değişken türleri için varsayılan atama yöntemlerini içeren, uzunluğu 4 olan bir vektör olmalıdır:
- Sürekli değişkenler,
- İkili (binary) değişkenler,
- Kategorik değişkenler (sırasız faktörler),
- Faktör değişkenler (sıralı faktörler).
Bu egzersizde, algoritmanın kullanacağı uygun yöntemleri seçmek için mice dokümantasyonundan yararlanacak ve mevcut yöntemlerin listesini inceleyeceksin. Haydi model seçimi yapalım!
Bu egzersiz
R'de Atamaya Dayalı Eksik Veri Doldurma
kursunun bir parçasıdırEgzersiz talimatları
?miceile açılan RDocumentation içinde, her yöntem için anahtar kelimenin yer aldığı bir tablo var.biopicsverisinimice()ile, şu varsayılan yöntemleri bu sırayla kullanarak ata: classification and regression trees, linear discriminant analysis, predictive mean matching, proportional odds model.- Hangi değişken için hangi yöntemin kullanıldığını görmek üzere
biopics_multiimp'i yazdır.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Impute biopics using the methods specified in the instruction
biopics_multiimp <- ___(biopics, m = 20,
defaultMethod = ___)
# Print biopics_multiimp
print(biopics_multiimp)