BaşlayınÜcretsiz Başlayın

KNN imputasyonu kullan

Önceki egzersizde, meme kanseri veri kümesindeki eksik değerleri doldurmak için medyan imputasyonu kullandın; ancak eksik verilerle başa çıkmanın tek yolu bu değil.

Medyan imputasyonuna bir alternatif de k-en yakın komşu, yani KNN, imputasyonudur. Bu, eksik değerlerin mevcut satıra benzer diğer satırlardaki değerlerle değiştirildiği daha gelişmiş bir imputasyon türüdür. Pratikte basit medyan imputasyonundan çok daha karmaşık olsa da, caret içinde train() fonksiyonunun preProcess argümanını kullanarak keşfetmesi çok kolaydır. Modeli kurmadan önce kullanılan imputasyon yöntemini değiştirmek için basitçe preProcess = "knnImpute" kullanabilirsin.

Bu egzersiz

R ile caret kullanarak Machine Learning

kursunun bir parçasıdır
Kursu Görüntüle

Egzersiz talimatları

breast_cancer_x ve breast_cancer_y çalışma alanına yüklendi.

  • Meme kanseri veri kümesine glm modeli uydurmak için train() fonksiyonunu kullan ve modeli knn_model olarak adlandır.
  • Eksik değerleri ele almak için KNN imputasyonunu kullan.

Uygulamalı interaktif egzersiz

Bu örnek kodu tamamlayarak bu egzersizi bitirin.

# Apply KNN imputation: knn_model
knn_model <- train(
  x = ___, 
  y = ___,
  method = ___,
  trControl = myControl,
  preProcess = ___
)

# Print knn_model to console
Kodu Düzenle ve Çalıştır