Çapraz doğrulama
Gördüğün gibi, çapraz doğrulama aşırı öğrenmeyi önlemek için akıllı bir yöntemdir. Bu egzersizde çapraz doğrulanmış doğruluğu (accuracy) hesaplayacaksın.
Hazırsın; gerekli veri defaultData ve model seni bekliyor. Doğruluk fonksiyonunu kodun ilk satırlarında bulacaksın. Bu, senin maliyet fonksiyonundur. Olduğu gibi bırak ve aşağıda cv.glm() çağrında kullan. Hadi dene!
Bu egzersiz, kursun bir parçasıdır
R ile Pazarlama Analitiği için Machine Learning
Egzersiz talimatları
bootpaketindekicv.glm()fonksiyonunu kullanarak 6 katlı bir çapraz doğrulama yap velogitModelNewmodeli için doğruluğu hesapla. Çapraz doğrulanmış doğruluk, sonucundeltaelemanının ilk konumunda saklanır.Çapraz doğrulama doğruluğunu örnek-içi (in-sample) doğrulamayla karşılaştır. Unutma, o değer
0.7922901idi.
Uygulamalı etkileşimli egzersiz
Bu egzersizi bu örnek kodu tamamlayarak deneyin.
library(boot)
# Accuracy function
costAcc <- function(r, pi = 0) {
cm <- confusion.matrix(r, pi, threshold = 0.3)
acc <- sum(diag(cm)) / sum(cm)
return(acc)
}
# Cross validated accuracy for logitModelNew
set.seed(534381)
cv.glm(___, ___, cost = ___, K = ___)$delta[1]