Ważność kolumn i domyślna predykcja

Gdy korzystasz z wielu zbiorów treningowych zawierających różne grupy kolumn, warto śledzić, które z nich mają znaczenie, a które nie. Utrzymywanie zestawu kolumn bez wpływu na loan_status może być kosztowne i czasochłonne.

Dane X dla tego ćwiczenia zostały utworzone za pomocą następującego kodu:

X = cr_loan_prep[['person_income','loan_int_rate',
                  'loan_percent_income','loan_amnt',
                  'person_home_ownership_MORTGAGE','loan_grade_F']]

Wytrenuj model XGBClassifier() na tych danych, a następnie sprawdź ważność kolumn, aby zobaczyć, jak każda z nich wpływa na przewidywanie loan_status.

Zbiór danych cr_loan_pret oraz X_train i y_train są już załadowane w środowisku pracy.

Utwórz i wytrenuj model XGBClassifier() na zbiorach treningowych X_train i y_train, a wynik zapisz jako clf_gbt.
Wyświetl ważności kolumn modelu clf_gbt, używając .get_booster() i .get_score().

ćwiczenie

Ważność kolumn i domyślna predykcja

Instrukcje

.css-6su6fj{-webkit-flex-shrink:0;-ms-flex-negative:0;flex-shrink:0;}ćwiczenie

Instrukcje

ćwiczenie