1. Learn
  2. /
  3. Courses
  4. /
  5. Modelarea Riscului de Credit în Python

Connected

Exercise

Predicția probabilității de nerambursare

Procesarea datelor este completă și a venit momentul să generezi predicții pentru probabilitatea de nerambursare. Vei antrena un model LogisticRegression() pe date și vei analiza cum prezice acesta probabilitatea de nerambursare.

Pentru a înțelege mai bine ce produce modelul cu predict_proba, aruncă o privire asupra unui exemplu de înregistrare alături de probabilitatea de nerambursare prezisă. Cum arată primele cinci predicții comparativ cu valorile reale ale loan_status?

Setul de date cr_loan_prep, împreună cu X_train, X_test, y_train și y_test, au fost deja încărcate în spațiul de lucru.

Instructions

100 XP
  • Antrenează un model de regresie logistică pe datele de antrenament și salvează-l în variabila clf_logistic.
  • Folosește predict_proba() pe datele de testare pentru a genera predicțiile și stochează-le în preds.
  • Creează două cadre de date, preds_df și true_df, pentru a stoca primele cinci predicții și, respectiv, valorile reale ale loan_status.
  • Afișează true_df și preds_df împreună, folosind .concat().