Menghitung confusion matrix
Sebuah confusion matrix (kadang disebut confusion table) adalah dasar dari semua metrik kinerja untuk model dengan respons kategorikal (seperti logistic regression). Tabel ini berisi jumlah tiap pasangan respons aktual–respons prediksi. Dalam kasus ini, ketika ada dua kemungkinan respons (churn atau tidak churn), ada empat kemungkinan hasil.
- True positive: Pelanggan melakukan churn dan model memprediksi demikian.
- False positive: Pelanggan tidak melakukan churn, tetapi model memprediksi sebaliknya.
- True negative: Pelanggan tidak melakukan churn dan model memprediksi demikian.
- False negative: Pelanggan melakukan churn, tetapi model memprediksi tidak.
churn dan mdl_churn_vs_relationship tersedia.
Latihan ini adalah bagian dari kursus
Pengantar Regresi dengan statsmodels di Python
Petunjuk latihan
- Dapatkan respons aktual dengan men-subset kolom
has_churneddari himpunan data. Simpan keactual_response. - Dapatkan respons prediksi "paling mungkin" dari model. Simpan ke
predicted_response. - Buat sebuah DataFrame dari
actual_responsedanpredicted_response. Simpan keoutcomes. - Cetak
outcomessebagai tabel hitungan, yang merepresentasikan confusion matrix. Ini telah dilakukan untuk Anda.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Get the actual responses
actual_response = ____
# Get the predicted responses
predicted_response = ____
# Create outcomes as a DataFrame of both Series
outcomes = pd.DataFrame({____,
____})
# Print the outcomes
print(outcomes.value_counts(sort = False))