mice akışı: mice - with - pool
Zincirlenmiş denklemlerle çoklu doldurma (MICE), koşullu dağılımlardan çekerek model tabanlı doldurmayı bir veri kümesine birden fazla kez uygulayarak doldurmadan kaynaklanan belirsizliği tahmin etmemizi sağlar. Böylece, her doldurulmuş veri kümesi birbirinden biraz farklı olur. Ardından her biri üzerinde bir analiz yapılır ve sonuçlar bir araya getirilerek ilgi duyulan büyüklükler, doldurma belirsizliğini yansıtan güven aralıklarıyla birlikte elde edilir.
Bu egzersizde, tipik MICE akışını uygulayacaksın: mice() - with() - pool(). biopics verisi üzerinde bir regresyon analizi yaparak hangi konu mesleğinin (sub_type) en yüksek film hasılatıyla ilişkili olduğunu göreceksin. Haydi mice ile oynayalım!
Bu egzersiz
R'de Atamaya Dayalı Eksik Veri Doldurma
kursunun bir parçasıdırEgzersiz talimatları
micepaketini yükle vebiopics'imice()ile 5 doldurma kullanarak doldur; sonucubiopics_multiimp'e ata.- Her doldurulmuş veri kümesi için
earnings'ıyearvesub_typeile açıklayan bir doğrusal regresyon modeli kur; sonuculm_multiimp'e ata. lm_multiimpiçinde saklanan regresyon modellerini bir araya getir; sonuculm_pooled'a ata.lm_pooled'u özetleyerek %95 güven düzeyinde güven aralıkları üretecek şekilde ayarla.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Load mice package
___
# Impute biopics with mice using 5 imputations
biopics_multiimp <- ___(___, m = ___, seed = 3108)
# Fit linear regression to each imputed data set
lm_multiimp <- ___(___, ___)
# Pool and summarize regression results
lm_pooled <- ___(___)
___(___, conf.int = ___, conf.level = ___)