1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Modelování kreditního rizika v R

Connected

cvičení

Více proměnných v logistickém regresním modelu

Interpretace jednoho parametru zůstává stejná i tehdy, když do modelu zahrneme více proměnných. Pokud chceš zjistit, jak se změní výsledek při změně určité proměnné, předpokládá se, že ostatní proměnné zůstávají konstantní. Pro tento princip existuje elegantní latinský výraz – ceteris paribus, doslova „za jinak stejných podmínek".

Pro sestavení logistického regresního modelu s více proměnnými je stačí spojit znaménkem +. Vzorec pak bude vypadat přibližně takto:

y ~ x1 + ... + xk

Při vyhodnocování modelu je potřeba mít na paměti několik věcí. Hodnoty parametrů jsou důležité, ale zdaleka ne jediné, na co se zaměřit. Neméně důležitá je statistická významnost odhadů jednotlivých parametrů. Ta se vyjadřuje pomocí p-hodnoty, v výstupu modelu ji najdeš pod označením Pr(>|t|). Ve výstupu funkce glm se slabá významnost označuje tečkou ".", silná pak hvězdičkami "***". Pokud parametr není statisticky významný, nelze tvrdit, že se jeho hodnota významně liší od 0. Statistická významnost je zásadní – interpretovat vliv na pravděpodobnost selhání dává smysl zpravidla jen u statisticky významných parametrů.

Pokyny

100 XP
  • Pomocí funkce glm() a datové sady training_set vytvoř logistický regresní model. Zahrň proměnné age, ir_cat, grade, loan_amnt a annual_inc. Model pojmenuj log_model_multi.
  • Pomocí funkce summary() aplikované na tento model zjisti úrovně statistické významnosti. V příští úloze se na jejich interpretaci podíváme podrobněji!