1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Supervised Learning v R: Klasifikace

Connected

cvičení

Sestavení jednoduchého rozhodovacího stromu

Dataset loans obsahuje 11 312 náhodně vybraných žadatelů, kteří požádali o půjčku u společnosti Lending Club – americké platformy pro půjčky mezi jednotlivci – a půjčku také obdrželi.

Použiješ rozhodovací strom, abys v datech odhalil/a vzory v tom, jak tyto půjčky dopadly (splacena nebo nesplacena), a to na základě požadované výše půjčky a kreditního skóre v době podání žádosti.

Potom se podívej, jak se předpovědi stromu liší pro žadatele s dobrým kreditním skóre oproti žadateli se špatným.

Datasety loans, good_credit a bad_credit jsou už načtené.

Pokyny

100 XP
  • Načti balíček rpart.
  • Natrénuj model rozhodovacího stromu pomocí funkce rpart().
    • Jako první argument zadej vzorec v R, který specifikuje outcome jako funkci proměnných loan_amount a credit_score.
    • Argument control teď nech být – o tom se dozvíš víc později!
  • Pomocí predict() a natrénovaného modelu předpověz výsledek pro žadatele good_credit. Použij argument type k předpovědi "class" výsledku.
  • Totéž proveď pro žadatele bad_credit.