1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Modelování kreditního rizika v R

Connected

Cvičení

Základní logistická regrese

Ve videu jsi viděl/a logistický regresní model zahrnující proměnnou age jako prediktor. Teď přidáš kategorickou proměnnou a naučíš se interpretovat její odhadnuté parametry.

Když do modelu logistické regrese v R zahrneme kategorickou proměnnou, získáme odhad parametru pro všechny její kategorie kromě jedné. Tato kategorie, pro kterou odhad parametru chybí, se nazývá referenční kategorie. Parametr každé z ostatních kategorií představuje poměr šancí (odds ratio) pro selhání splácení úvěru mezi danou kategorií a referenční kategorií. Zatím si s tím nedělej starosti – v dalších cvičeních se k tomu ještě vrátíme!

Pokyny

100 XP
  • Sestav model logistické regrese s názvem log_model_cat, ve kterém bude jako jediný prediktor kategorická proměnná ir_cat. Volání funkce glm() musí obsahovat tři argumenty:
  • loan_status ~ ir_cat
  • family = "binomial"
  • data = training_set
  • Výsledek si zobraz v konzoli a prohlédni si odhadnuté parametry.
  • Zjisti, která kategorie je referenční, a to tak, že se znovu podíváš na strukturu proměnné ir_cat (v celém datasetu loan_data). Použij k tomu funkci table().