Temerrüt olasılığını tahmin etme
Tüm veri işleme adımları tamamlandı ve artık temerrüt olasılığı için tahminler üretmeye başlayabilirsin. Veriler üzerinde bir LogisticRegression() modeli eğitmek ve temerrüt olasılığını nasıl tahmin ettiğini incelemek istiyorsun.
Modelin predict_proba ile ne ürettiğini daha iyi kavrayabilmen için, tahmin edilen temerrüt olasılığıyla birlikte örnek bir kayda bakmalısın. İlk beş tahmin, loan_status'un gerçek değerlerine karşılaştırıldığında nasıl görünüyor?
cr_loan_prep veri kümesi ile X_train, X_test, y_train ve y_test çalışma alanına zaten yüklendi.
Bu egzersiz
Python ile Kredi Riski Modellemesi
kursunun bir parçasıdırEgzersiz talimatları
- Eğitim verisi üzerinde bir lojistik regresyon modeli eğit ve
clf_logisticolarak sakla. - Test verisi üzerinde
predict_proba()kullanarak tahminleri oluştur vepredsdeğişkeninde sakla. - İlk beş tahmini ve gerçek
loan_statusdeğerlerini saklamak için iki veri çerçevesi,preds_dfvetrue_df, oluştur. true_dfvepreds_df'yi.concat()kullanarak tek bir küme olarak yazdır.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Train the logistic regression model on the training data
____ = ____(solver='lbfgs').____(____, np.ravel(____))
# Create predictions of probability for loan status using test data
____ = clf_logistic.____(____)
# Create dataframes of first five predictions, and first five true labels
____ = pd.DataFrame(____[:,1][0:5], columns = ['prob_default'])
____ = y_test.____()
# Concatenate and print the two data frames for comparison
print(pd.____([true_df.reset_index(drop = True), preds_df], axis = 1))