Çapraz doğrulama
Gördüğün gibi, çapraz doğrulama aşırı öğrenmeyi önlemek için akıllı bir yöntemdir. Bu egzersizde çapraz doğrulanmış doğruluğu (accuracy) hesaplayacaksın.
Hazırsın; gerekli veri defaultData ve model seni bekliyor. Doğruluk fonksiyonunu kodun ilk satırlarında bulacaksın. Bu, senin maliyet fonksiyonundur. Olduğu gibi bırak ve aşağıda cv.glm() çağrında kullan. Hadi dene!
Bu egzersiz
R ile Pazarlama Analitiği için Machine Learning
kursunun bir parçasıdırEgzersiz talimatları
bootpaketindekicv.glm()fonksiyonunu kullanarak 6 katlı bir çapraz doğrulama yap velogitModelNewmodeli için doğruluğu hesapla. Çapraz doğrulanmış doğruluk, sonucundeltaelemanının ilk konumunda saklanır.Çapraz doğrulama doğruluğunu örnek-içi (in-sample) doğrulamayla karşılaştır. Unutma, o değer
0.7922901idi.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
library(boot)
# Accuracy function
costAcc <- function(r, pi = 0) {
cm <- confusion.matrix(r, pi, threshold = 0.3)
acc <- sum(diag(cm)) / sum(cm)
return(acc)
}
# Cross validated accuracy for logitModelNew
set.seed(534381)
cv.glm(___, ___, cost = ___, K = ___)$delta[1]