1. Nauka
  2. /
  3. Kursy
  4. /
  5. Modelowanie ryzyka kredytowego w Pythonie

Connected

ćwiczenie

Ważność kolumn i domyślna predykcja

Gdy korzystasz z wielu zbiorów treningowych zawierających różne grupy kolumn, warto śledzić, które z nich mają znaczenie, a które nie. Utrzymywanie zestawu kolumn bez wpływu na loan_status może być kosztowne i czasochłonne.

Dane X dla tego ćwiczenia zostały utworzone za pomocą następującego kodu:

X = cr_loan_prep[['person_income','loan_int_rate',
                  'loan_percent_income','loan_amnt',
                  'person_home_ownership_MORTGAGE','loan_grade_F']]

Wytrenuj model XGBClassifier() na tych danych, a następnie sprawdź ważność kolumn, aby zobaczyć, jak każda z nich wpływa na przewidywanie loan_status.

Zbiór danych cr_loan_pret oraz X_train i y_train są już załadowane w środowisku pracy.

Instrukcje

100 XP
  • Utwórz i wytrenuj model XGBClassifier() na zbiorach treningowych X_train i y_train, a wynik zapisz jako clf_gbt.
  • Wyświetl ważności kolumn modelu clf_gbt, używając .get_booster() i .get_score().