Iris yeniden: daha sağlam bir doğruluk.
Bu egzersizde, iris veri kümesinin 100 farklı eğitim/test bölümlemesi için doğrusal SVM'ler kuracaksın. Ardından, ortalama doğruluğu ve standart sapmayı hesaplayarak modelinin performansını değerlendireceksin. Oldukça genel olan bu prosedür, tek bir bölümlemeden elde edilenlere kıyasla model performansına çok daha sağlam bir ölçüm sağlar.
Bu egzersiz, kursun bir parçasıdır
R ile Support Vector Machines
Egzersiz talimatları
- Her deneme için:
- Veri kümesini rastgele %80 eğitim / %20 test olacak şekilde böl.
- Eğitim veri kümesi üzerinde varsayılan maliyetli doğrusal bir SVM kur.
- Modelinin doğruluğunu değerlendir (
accuracyçalışma ortamında başlatıldı).
Uygulamalı etkileşimli egzersiz
Bu egzersizi bu örnek kodu tamamlayarak deneyin.
for (i in 1:___){
#assign 80% of the data to the training set
sample_size <- ___(___ * nrow(iris))
train <- ___(seq_len(nrow(iris)), size = ___)
trainset <- iris[train, ]
testset <- iris[-train, ]
#build model using training data
svm_model <- svm(Species~ ., data = ___,
type = "C-classification", kernel = "linear")
#calculate accuracy on test data
pred_test <- predict(svm_model, ___)
accuracy[i] <- mean(pred_test == ___$Species)
}
mean(___)
sd(___)