1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Supervised Learning v R: Klasifikace

Connected

cvičení

Sestavení modelu pomocí postupné regrese

Pokud nemáš k dispozici odborné znalosti z dané oblasti, může ti postupná regrese (stepwise regression) pomoct najít nejdůležitější prediktory sledovaného výsledku.

V tomto cvičení použiješ přístup dopředné postupné regrese, kdy přidáváš prediktory do modelu jeden po druhém, dokud nepřestane přinášet další zlepšení. Dataset donors je již načtený.

Pokyny

100 XP
  • Pomocí rozhraní vzorců R a funkce glm() definuj základní model bez prediktorů. Nastav vysvětlující proměnnou na 1.
  • Pomocí rozhraní vzorců R a funkce glm() definuj model se všemi prediktory.
  • Aplikuj step() na tyto modely pro provedení dopředné postupné regrese. Nastav první argument na null_model a direction = "forward". Může to chvíli trvat (až 10–15 sekund), protože počítač musí otestovat celou řadu různých modelů.
  • Vytvoř vektor predikovaných pravděpodobností pomocí funkce predict().
  • Vykresli ROC křivku pomocí roc() a plot() a spočítej AUC postupného modelu pomocí auc().