1. Nauka
  2. /
  3. Kursy
  4. /
  5. Modelowanie ryzyka kredytowego w Pythonie

Connected

ćwiczenie

Podstawy regresji logistycznej

Dane zostały już wyczyszczone i powstał nowy zbiór cr_loan_clean.

Przypomni sobie ostatni wykres punktowy z rozdziału 1, który pokazał, że większa liczba niespłaconych kredytów wiąże się z wysokim loan_int_rate. Stopy procentowe są łatwe do zrozumienia, ale czy naprawdę dobrze nadają się do przewidywania prawdopodobieństwa niewywiązania się ze spłaty?

Ponieważ nie próbowałeś jeszcze prognozować prawdopodobieństwa defaultu, sprawdź, jak działa model regresji logistycznej oparty wyłącznie na loan_int_rate. Przyjrzyj się też wewnętrznym parametrom modelu – określają one jego strukturę dla tej jednej kolumny.

Zbiór danych cr_loan_clean jest już wczytany do środowiska pracy.

Instrukcje

100 XP
  • Utwórz zestawy X i y, korzystając z kolumn loan_int_rate oraz loan_status.
  • Utwórz model regresji logistycznej, dopasuj go do danych treningowych i nadaj mu nazwę clf_logistic_single.
  • Wyświetl parametry modelu za pomocą .get_params().
  • Sprawdź wyraz wolny modelu, korzystając z atrybutu .intercept_.