Menghitung confusion matrix
Sebuah confusion matrix (kadang disebut confusion table) adalah dasar dari semua metrik kinerja untuk model dengan respons kategorikal (seperti regresi logistik). Matriks ini memuat jumlah setiap pasangan respons aktual–respons prediksi. Dalam kasus ini, ketika ada dua kemungkinan respons (churn atau tidak churn), terdapat empat kemungkinan hasil.
- Nasabah melakukan churn dan model memprediksikannya.
- Nasabah melakukan churn tetapi model tidak memprediksikannya.
- Nasabah tidak melakukan churn tetapi model memprediksi sebaliknya.
- Nasabah tidak melakukan churn dan model memprediksikannya.
churn dan mdl_churn_vs_relationship tersedia.
Latihan ini adalah bagian dari kursus
Pengantar Regresi di R
Petunjuk latihan
- Ambil respons aktual dari kolom
has_churnedpada himpunan data. Simpan keactual_response. - Dapatkan respons terprediksi "paling mungkin" dari model. Simpan ke
predicted_response. - Buat tabel jumlah dari vektor respons aktual dan prediksi. Simpan ke
outcomes.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Get the actual responses from the dataset
actual_response <- ___
# Get the "most likely" responses from the model
predicted_response <- ___
# Create a table of counts
outcomes <- ___
# See the result
outcomes