1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Supervised Learning v R: Klasifikace

Connected

cvičení

Vytvoření pěkně ořezaného stromu

Pokud strom zastavíme příliš brzy, může přehlédnout některé vzory v datech nebo přijít o důležité trendy, které by odhalil až později.

Post-pruning ti umožňuje záměrně nechat strom vyrůst do velké a složité podoby a teprve poté ho zmenšit a zpřehlednit.

V tomto cvičení si sestavíš vizualizaci závislosti výkonu stromu na jeho komplexitě a na základě těchto informací strom ořežeš na odpovídající úroveň.

Balíček rpart je předem načtený spolu s loans_test a loans_train.

Pokyny

100 XP
  • Použij všechny proměnné žadatele a bez předčasného ořezávání vytvoř zbytečně složitý strom. Nezapomeň nastavit cp = 0 v rpart.control(), aby nedocházelo k předčasnému ořezání.
  • Vytvoř graf komplexity pomocí plotcp() na modelu.
  • Na základě grafu komplexity ořež strom na hodnotu komplexity 0,0014 pomocí funkce prune() – předej jí strom a parametr komplexity.
  • Porovnej přesnost ořezaného stromu s původní přesností 58,3 %. Pro výpočet přesnosti použij funkce predict() a mean().