Iris ulang - akurasi yang lebih tangguh.
Dalam latihan ini, Anda akan membangun SVM linear untuk 100 partisi latih/uji yang berbeda dari himpunan data iris. Anda kemudian akan mengevaluasi kinerja model dengan menghitung akurasi rata-rata dan simpangan baku. Prosedur yang cukup umum ini akan memberikan ukuran kinerja model yang jauh lebih tangguh dibandingkan yang diperoleh dari satu partisi saja.
Latihan ini adalah bagian dari kursus
Support Vector Machines di R
Petunjuk latihan
- Untuk setiap percobaan:
- Bagi himpunan data menjadi data latih dan data uji secara acak dengan perbandingan 80/20.
- Bangun SVM linear dengan cost default pada data latih.
- Evaluasi akurasi model Anda (
accuracytelah diinisialisasi di lingkungan Anda).
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
for (i in 1:___){
#assign 80% of the data to the training set
sample_size <- ___(___ * nrow(iris))
train <- ___(seq_len(nrow(iris)), size = ___)
trainset <- iris[train, ]
testset <- iris[-train, ]
#build model using training data
svm_model <- svm(Species~ ., data = ___,
type = "C-classification", kernel = "linear")
#calculate accuracy on test data
pred_test <- predict(svm_model, ___)
accuracy[i] <- mean(pred_test == ___$Species)
}
mean(___)
sd(___)