MulaiMulai sekarang secara gratis

Menghitung confusion matrix

Sebuah confusion matrix (kadang disebut confusion table) adalah dasar dari semua metrik kinerja untuk model dengan respons kategorikal (seperti logistic regression). Tabel ini berisi jumlah tiap pasangan respons aktual–respons prediksi. Dalam kasus ini, ketika ada dua kemungkinan respons (churn atau tidak churn), ada empat kemungkinan hasil.

  1. True positive: Pelanggan melakukan churn dan model memprediksi demikian.
  2. False positive: Pelanggan tidak melakukan churn, tetapi model memprediksi sebaliknya.
  3. True negative: Pelanggan tidak melakukan churn dan model memprediksi demikian.
  4. False negative: Pelanggan melakukan churn, tetapi model memprediksi tidak.

churn dan mdl_churn_vs_relationship tersedia.

Latihan ini adalah bagian dari kursus

Pengantar Regresi dengan statsmodels di Python

Lihat Kursus

Petunjuk latihan

  • Dapatkan respons aktual dengan men-subset kolom has_churned dari himpunan data. Simpan ke actual_response.
  • Dapatkan respons prediksi "paling mungkin" dari model. Simpan ke predicted_response.
  • Buat sebuah DataFrame dari actual_response dan predicted_response. Simpan ke outcomes.
  • Cetak outcomes sebagai tabel hitungan, yang merepresentasikan confusion matrix. Ini telah dilakukan untuk Anda.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Get the actual responses
actual_response = ____

# Get the predicted responses
predicted_response = ____

# Create outcomes as a DataFrame of both Series
outcomes = pd.DataFrame({____,
                         ____})

# Print the outcomes
print(outcomes.value_counts(sort = False))
Edit dan Jalankan Kode