1. Uczyć się
  2. /
  3. Courses
  4. /
  5. Modelowanie ryzyka kredytowego w R

Connected

Exercise

Podstawy regresji logistycznej

W lekcji wideo analizowaliśmy model regresji logistycznej ze zmienną age jako predyktorem. Teraz użyjesz zmiennej kategorycznej i nauczysz się interpretować jej oszacowania parametrów.

Gdy do modelu regresji logistycznej w R dodasz zmienną kategoryczną, otrzymasz oszacowanie parametru dla wszystkich jej kategorii oprócz jednej. Kategoria, dla której nie ma oszacowania parametru, nazywana jest kategorią referencyjną. Parametr dla każdej z pozostałych kategorii reprezentuje iloraz szans na niewywiązanie się ze spłaty kredytu między daną kategorią a kategorią referencyjną. Nie martw się, jeśli na razie nie jest to do końca jasne – w kolejnych ćwiczeniach dokładniej zgłębisz ten temat!

Instrukcje

100 XP
  • Zbuduj model regresji logistycznej o nazwie log_model_cat, używając zmiennej kategorycznej ir_cat jako jedynego predyktora. Wywołanie funkcji glm() powinno zawierać trzy argumenty:
  • loan_status ~ ir_cat
  • family = "binomial"
  • data = training_set
  • Wyświetl wynik w konsoli, aby zobaczyć oszacowania parametrów.
  • Sprawdź, która kategoria jest kategorią referencyjną, analizując strukturę zmiennej ir_cat (w pełnym zbiorze danych loan_data). Użyj do tego funkcji table().