BaşlayınÜcretsiz Başlayın

Gerçek dünya maliyet analizi

Bu egzersizde yine kredi veri kümesi üzerinde çalışacaksın. Bu veri kümesinde bir "pozitif" "kötü kredi" anlamına gelir; yani kredisini ödeyemeyen müşteri. "Negatif" ise ödemelerine sorunsuz devam eden müşteri demektir. Banka müdürü, her bir "iyi risk" müşterisinden bankanın ortalama 10K kâr ettiğini, ancak her bir "kötü risk" müşterisinden 150K zarar ettiğini bildirdi. Algoritman başvuru sahiplerini elemek için kullanılacak; bu nedenle "negatif" olarak etiketlenenlere kredi verilecek, "pozitif" olanlar ise reddedilecek. Sınıflandırıcının toplam maliyeti nedir? Veriler X_train, X_test, y_train ve y_test olarak hazır. confusion_matrix(), f1_score(), precision_score() ve RandomForestClassifier() fonksiyonları mevcut.

Bu egzersiz

Python'da Machine Learning İş Akışları Tasarlama

kursunun bir parçasıdır
Kursu Görüntüle

Egzersiz talimatları

  • Eğitim verisine bir rastgele orman sınıflandırıcısı uygula.
  • Bunu kullanarak test verisini etiketle.
  • confusion_matrix() çıktısından yanlış negatifleri ve yanlış pozitifleri çıkar. Matrisi düzleştirmen gerekecek.
  • "İyi" bir müşteriyi yanlışlıkla "kötü" sınıflandırmak, bankanın 10K kâr fırsatını kaçırması demektir. "Kötü" bir müşteriyi yanlışlıkla "iyi" sınıflandırmak ise müşterinin krediyi ödeyememesi nedeniyle bankanın 150K zarar etmesi anlamına gelir.

Uygulamalı interaktif egzersiz

Bu örnek kodu tamamlayarak bu egzersizi bitirin.

# Fit a random forest classifier to the training data
clf = ____(random_state=2).fit(____, ____)

# Label the test data
preds = clf.____(____)

# Get false positives/negatives from the confusion matrix
tn, ____, ____, tp = confusion_matrix(y_test, preds).____()

# Now compute the cost using the manager's advice
cost = fp*____ + fn*____
Kodu Düzenle ve Çalıştır