1. Nauka
  2. /
  3. Kursy
  4. /
  5. Modelowanie ryzyka kredytowego w R

Connected

ćwiczenie

Porównanie funkcji łącza dla danego punktu odcięcia

W tym ostatnim ćwiczeniu dopasuj model z wykorzystaniem każdej z trzech funkcji łącza (logit, probit i cloglog), wykonaj predykcje dla zbioru testowego, sklasyfikuj wyniki do odpowiedniej grupy (niewywiązanie się ze zobowiązania lub jego brak) dla danego punktu odcięcia, zbuduj macierz pomyłek i oblicz dokładność oraz czułość każdego z modeli! To naprawdę dużo wiedzy w krótkim czasie. Na koniec spróbuj wskazać model, który osiąga najlepszą dokładność przy danym punkcie odcięcia!

Warto wiedzieć, że różnice między modelami będą zazwyczaj bardzo małe, a wyniki zależą od wybranego punktu odcięcia. Obserwowany wynik (niewywiązanie się ze zobowiązania lub jego brak) jest przechowywany w zmiennej true_val w konsoli.

Instrukcje

100 XP
  • Dopasuj trzy modele regresji logistycznej, używając odpowiednio funkcji łącza logit, probit i cloglog. Część kodu jest już gotowa. Użyj zmiennych age, emp_cat, ir_cat i loan_amnt jako predyktorów.
  • Wykonaj predykcje dla wszystkich modeli na zbiorze test_set.
  • Użyj punktu odcięcia wynoszącego 14%, aby sklasyfikować predykcje każdego z modeli i umożliwić ocenę ich wydajności.
  • Zbuduj macierz pomyłek dla wszystkich trzech modeli.
  • Na koniec oblicz dokładność klasyfikacji dla każdego z trzech modeli.