Menguji nilai 'k' lainnya
Secara default, fungsi knn() dalam paket class hanya menggunakan satu tetangga terdekat.
Menetapkan parameter k memungkinkan algoritma mempertimbangkan tetangga terdekat tambahan. Ini memperbesar kumpulan tetangga yang akan memberikan suara pada kelas yang diprediksi.
Bandingkan nilai k sebesar 1, 7, dan 15 untuk menelaah dampaknya terhadap akurasi klasifikasi rambu lalu lintas.
Paket class sudah dimuat di workspace Anda bersama dengan himpunan data signs, signs_test, dan sign_types. Objek signs_actual menyimpan nilai sebenarnya dari rambu-rambu tersebut.
Latihan ini adalah bagian dari kursus
Supervised Learning di R: Klasifikasi
Petunjuk latihan
- Hitung akurasi model default
k = 1menggunakan kode yang diberikan, lalu temukan akurasi model tersebut denganmean()untuk membandingkansigns_actualdan prediksi model. - Ubah pemanggilan fungsi
knn()dengan menetapkank = 7dan kembali cari nilai akurasinya. - Revisi kode sekali lagi dengan menetapkan
k = 15, lalu cari lagi nilai akurasinya.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Compute the accuracy of the baseline model (default k = 1)
k_1 <- knn(train = ___, test = ___, cl = ___)
mean(___)
# Modify the above to set k = 7
k_7 <- ___
mean(___)
# Set k = 15 and compare to the above
k_15 <- ___
mean(___)