Eksik verilerle doğrusal regresyon
Eksik veri yaygın bir problemdir ve bununla doğru şekilde başa çıkmak son derece önemlidir. Eksik gözlemleri yok saymak ya da yanlış doldurmak, modellerin beklenmedik şekilde çalışmasına ve tahminler ile çıkarımların yanlı olmasına yol açabilir.
Bu bölümde biopics veri kümesiyle çalışacaksın. Bu veri kümesi; filmlerin hasılatları, konu alınan kişilerin özellikleri ve bazı diğer değişkenler de dahil olmak üzere bir dizi biyografik film hakkında bilgi içerir. Ancak bazı veri noktaları eksik. Verinin orijinali fivethirtyeight R paketinden geliyor; fakat bu derste biraz ön işlenmiş bir sürümüyle çalışacaksın.
Bu egzersizde, veri kümesini tanıyacak ve bir filmin hasılatını açıklamak için bir doğrusal regresyon modeli kuracaksın. Hadi başlayalım!
Bu egzersiz
R'de Atamaya Dayalı Eksik Veri Doldurma
kursunun bir parçasıdırUygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Print first 10 observations
___(biopics, ___)