1. Learn
  2. /
  3. कोर्स
  4. /
  5. Reducerea dimensionalității în R

Connected

अभ्यास

Creează un model complet de pădure aleatorie

Modelele de tip pădure aleatorie realizează în mod natural selecția caracteristicilor, deoarece construiesc mulți subarbori din subseturi aleatoare ale acestora. O modalitate de a înțelege importanța caracteristicilor este să antrenezi un model și apoi să extragi aceste importanțe. Prin urmare, în acest exercițiu vei folosi datele Healthcare Job Attrition pentru a antrena un model de clasificare rand_forest(), din care poți extrage importanțele caracteristicilor. Pentru a face importanțele disponibile, asigură-te că creezi modelul cu importance = "impurity". Seturile train și test sunt disponibile.

Pachetele tidyverse, tidymodels și vip au fost deja încărcate.

निर्देश

100 XP
  • Definește un model de clasificare de tip pădure aleatorie cu 200 de arbori, din care să poți extrage importanțele caracteristicilor.
  • Antrenează modelul de pădure aleatorie folosind toți predictorii.
  • Atașează predicțiile la setul de testare.
  • Calculează metrica F1.