Evaluasi klasifikasi
Pada pelajaran sebelumnya, Anda telah membangun model logistic untuk memprediksi penyakit Parkinson. Pada latihan ini, Anda akan membandingkan prediksi dengan nilai aktual.
Kemampuan ini sangat penting karena perusahaan berfokus pada hasil. Perekrut ingin mengetahui seberapa akurat model yang Anda kembangkan.
Sekali lagi, Anda akan membangun model untuk memprediksi status penyakit Parkinson. Kali ini, Anda akan membangun model pada sebagian himpunan data dan menggunakan sisanya untuk pengujian.
Ingat bahwa \(\text{recall} = \frac{TP}{TP+FN}\).
\(TP\) berarti kita memprediksi nilai positif dan prediksi tersebut benar.
\(FN\) berarti kita memprediksi nilai negatif tetapi prediksi tersebut salah.
Sekitar 80% baris pada himpunan data parkinsons telah dialokasikan ke train, dan sisanya dialokasikan ke test.
Latihan ini adalah bagian dari kursus
Latihan Pertanyaan Wawancara Statistik di R
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Build a logistic model on the train data
model <- ___(___ ~ NHR + ___, data = ___, family = ___)
# Calculate probabilities for the test data
probabilities <- ___(___, newdata = ___, type = ___)