Karmaşıklık matrisini hesaplama
Bir confusion matrix (bazen confusion table olarak da adlandırılır), kategorik bir yanıtı olan modellerin (örneğin lojistik regresyon) tüm performans ölçütlerinin temelidir. Her bir gerçek yanıt–tahmin edilen yanıt çiftinin sayılarını içerir. Bu örnekte iki olası yanıt olduğu için (müşteri ayrıldı veya ayrılmadı) toplam dört olası sonuç vardır.
- True positive: Müşteri ayrıldı ve model ayrılacağını tahmin etti.
- False positive: Müşteri ayrılmadı ama model ayrılacağını tahmin etti.
- True negative: Müşteri ayrılmadı ve model ayrılmayacağını tahmin etti.
- False negative: Müşteri ayrıldı ama model ayrılmayacağını tahmin etti.
churn ve mdl_churn_vs_relationship hazır durumda.
Bu egzersiz
Python ile statsmodels kullanarak Regresyona Giriş
kursunun bir parçasıdırEgzersiz talimatları
- Gerçek yanıtları, veri kümesinin
has_churnedsütununu alt kümeleyerek al.actual_responseolarak ata. - Modelden "en olası" tahmin edilen yanıtları al.
predicted_responseolarak ata. actual_responsevepredicted_response'dan bir DataFrame oluştur.outcomesolarak ata.outcomes'ı bir sayı tablosu olarak yazdır; bu, karmaşıklık matrisini temsil eder. Bu senin için yapıldı.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Get the actual responses
actual_response = ____
# Get the predicted responses
predicted_response = ____
# Create outcomes as a DataFrame of both Series
outcomes = pd.DataFrame({____,
____})
# Print the outcomes
print(outcomes.value_counts(sort = False))