1. Nauka
  2. /
  3. Kursy
  4. /
  5. Modelowanie ryzyka kredytowego w Pythonie

Connected

ćwiczenie

Wielowymiarowa regresja logistyczna

Zazwyczaj do przewidywania prawdopodobieństwa niewywiązania się ze spłaty nie używa się wyłącznie loan_int_rate. Warto wykorzystać wszystkie dostępne dane, aby uzyskać jak najlepsze prognozy.

Mając to na uwadze, spróbuj wytrenować nowy model, korzystając z różnych kolumn – zwanych cechami – ze zbioru danych cr_loan_clean. Czy ten model będzie się różnić od poprzedniego? Łatwo to sprawdzić, porównując wartość .intercept_ regresji logistycznej. Pamiętaj, że jest to punkt przecięcia funkcji z osią Y oraz ogólny log-odds braku niewywiązania się ze spłaty.

Zbiór danych cr_loan_clean został wczytany do środowiska pracy wraz z poprzednim modelem clf_logistic_single.

Instrukcje

100 XP
  • Utwórz nowy zbiór danych X z kolumnami loan_int_rate i person_emp_length. Zapisz go jako X_multi.
  • Utwórz zbiór danych y zawierający tylko kolumnę loan_status.
  • Utwórz model LogisticRegression() i dopasuj go do nowego zbioru X za pomocą metody .fit(). Zapisz model jako clf_logistic_multi.
  • Wyświetl wartość .intercept_ modelu.