Iris yeniden: daha sağlam bir doğruluk.
Bu egzersizde, iris veri kümesinin 100 farklı eğitim/test bölümlemesi için doğrusal SVM'ler kuracaksın. Ardından, ortalama doğruluğu ve standart sapmayı hesaplayarak modelinin performansını değerlendireceksin. Oldukça genel olan bu prosedür, tek bir bölümlemeden elde edilenlere kıyasla model performansına çok daha sağlam bir ölçüm sağlar.
Bu egzersiz
R ile Support Vector Machines
kursunun bir parçasıdırEgzersiz talimatları
- Her deneme için:
- Veri kümesini rastgele %80 eğitim / %20 test olacak şekilde böl.
- Eğitim veri kümesi üzerinde varsayılan maliyetli doğrusal bir SVM kur.
- Modelinin doğruluğunu değerlendir (
accuracyçalışma ortamında başlatıldı).
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
for (i in 1:___){
#assign 80% of the data to the training set
sample_size <- ___(___ * nrow(iris))
train <- ___(seq_len(nrow(iris)), size = ___)
trainset <- iris[train, ]
testset <- iris[-train, ]
#build model using training data
svm_model <- svm(Species~ ., data = ___,
type = "C-classification", kernel = "linear")
#calculate accuracy on test data
pred_test <- predict(svm_model, ___)
accuracy[i] <- mean(pred_test == ___$Species)
}
mean(___)
sd(___)