1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Supervised Learning v R: Klasifikace

Connected

cvičení

Sestavení a vyhodnocení většího stromu

V předchozím cvičení jsi sestavil/a jednoduchý rozhodovací strom, který k předpovědi výsledku půjčky využíval kreditní skóre žadatele a požadovanou výši úvěru.

Lending Club má o žadatelích k dispozici i další informace – například status vlastnictví bydlení, délku zaměstnání, účel půjčky nebo historii bankrotů – které mohou pomoci zpřesnit předpovědi.

Využij všechna dostupná data o žadatelích a postav sofistikovanější model na náhodném trénovacím datasetu vytvořeném dříve. Potom tento model použij k předpovědím na testovacím datasetu a odhadni, jak dobře by fungoval při hodnocení budoucích žádostí o půjčku.

Balíček rpart je předem načtený a datasety loans_train a loans_test jsou připravené k použití.

Pokyny

100 XP
  • Pomocí rpart() sestav model půjček na trénovacím datasetu se všemi dostupnými prediktory. Argument control opět nechej beze změny.
  • Aplikuj funkci predict() na testovací dataset a vytvoř vektor předpovězených výsledků. Nezapomeň na argument type.
  • Vytvoř table(), která porovná předpovězené hodnoty se skutečnými hodnotami proměnné outcome.
  • Pomocí funkce mean() vypočítej přesnost předpovědí.