KNN imputasyonu kullan
Önceki egzersizde, meme kanseri veri kümesindeki eksik değerleri doldurmak için medyan imputasyonu kullandın; ancak eksik verilerle başa çıkmanın tek yolu bu değil.
Medyan imputasyonuna bir alternatif de k-en yakın komşu, yani KNN, imputasyonudur. Bu, eksik değerlerin mevcut satıra benzer diğer satırlardaki değerlerle değiştirildiği daha gelişmiş bir imputasyon türüdür. Pratikte basit medyan imputasyonundan çok daha karmaşık olsa da, caret içinde train() fonksiyonunun preProcess argümanını kullanarak keşfetmesi çok kolaydır. Modeli kurmadan önce kullanılan imputasyon yöntemini değiştirmek için basitçe preProcess = "knnImpute" kullanabilirsin.
Bu egzersiz
R ile caret kullanarak Machine Learning
kursunun bir parçasıdırEgzersiz talimatları
breast_cancer_x ve breast_cancer_y çalışma alanına yüklendi.
- Meme kanseri veri kümesine
glmmodeli uydurmak içintrain()fonksiyonunu kullan ve modeliknn_modelolarak adlandır. - Eksik değerleri ele almak için KNN imputasyonunu kullan.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Apply KNN imputation: knn_model
knn_model <- train(
x = ___,
y = ___,
method = ___,
trControl = myControl,
preProcess = ___
)
# Print knn_model to console