1. Nauka
  2. /
  3. Kursy
  4. /
  5. Modelowanie ryzyka kredytowego w Pythonie

Connected

ćwiczenie

Tworzenie zbiorów treningowego i testowego

Udało ci się wytrenować modele LogisticRegression() na różnych kolumnach.

Wiesz już, że dane należy podzielić na zbiór treningowy i testowy. Funkcja test_train_split() pozwala utworzyć oba zbiory jednocześnie. Zbiór treningowy służy do uczenia modelu, a testowy – do jego oceny. Bez ewaluacji nie ma możliwości sprawdzenia, jak dobrze model poradzi sobie z nowymi danymi kredytowymi.

Oprócz atrybutu intercept_ modele LogisticRegression() mają również atrybut .coef_. Pokazuje on, jak duży wpływ na przewidywanie prawdopodobieństwa niewykonania zobowiązania ma każda z kolumn treningowych.

Zbiór danych cr_loan_clean jest już wczytany do obszaru roboczego.

Instrukcje

100 XP
  • Utwórz zbiór X z kolumnami: stopa procentowa, staż zatrudnienia i dochód. Utwórz zbiór y z kolumną statusu kredytu.
  • Użyj funkcji train_test_split(), aby podzielić X i y na zbiory treningowy i testowy.
  • Utwórz i wytrenuj model LogisticRegression(), zapisując go jako clf_logistic.
  • Wyświetl współczynniki modelu za pomocą .coef_.