BaşlayınÜcretsiz başlayın

Gerçek dünya maliyet analizi

Bu egzersizde yine kredi veri kümesi üzerinde çalışacaksın. Bu veri kümesinde bir "pozitif" "kötü kredi" anlamına gelir; yani kredisini ödeyemeyen müşteri. "Negatif" ise ödemelerine sorunsuz devam eden müşteri demektir. Banka müdürü, her bir "iyi risk" müşterisinden bankanın ortalama 10K kâr ettiğini, ancak her bir "kötü risk" müşterisinden 150K zarar ettiğini bildirdi. Algoritman başvuru sahiplerini elemek için kullanılacak; bu nedenle "negatif" olarak etiketlenenlere kredi verilecek, "pozitif" olanlar ise reddedilecek. Sınıflandırıcının toplam maliyeti nedir? Veriler X_train, X_test, y_train ve y_test olarak hazır. confusion_matrix(), f1_score(), precision_score() ve RandomForestClassifier() fonksiyonları mevcut.

Bu egzersiz, kursun bir parçasıdır

Python'da Machine Learning İş Akışları Tasarlama

Kursa Göz Atın

Egzersiz talimatları

  • Eğitim verisine bir rastgele orman sınıflandırıcısı uygula.
  • Bunu kullanarak test verisini etiketle.
  • confusion_matrix() çıktısından yanlış negatifleri ve yanlış pozitifleri çıkar. Matrisi düzleştirmen gerekecek.
  • "İyi" bir müşteriyi yanlışlıkla "kötü" sınıflandırmak, bankanın 10K kâr fırsatını kaçırması demektir. "Kötü" bir müşteriyi yanlışlıkla "iyi" sınıflandırmak ise müşterinin krediyi ödeyememesi nedeniyle bankanın 150K zarar etmesi anlamına gelir.

Uygulamalı etkileşimli egzersiz

Bu egzersizi bu örnek kodu tamamlayarak deneyin.

# Fit a random forest classifier to the training data
clf = ____(random_state=2).fit(____, ____)

# Label the test data
preds = clf.____(____)

# Get false positives/negatives from the confusion matrix
tn, ____, ____, tp = confusion_matrix(y_test, preds).____()

# Now compute the cost using the manager's advice
cost = fp*____ + fn*____
Kodu Düzenle ve Çalıştır