1. Learn
  2. /
  3. Cursuri
  4. /
  5. Reducerea dimensionalității în R

Connected

exercițiu

Reducerea datelor folosind importanța caracteristicilor

Acum că ai creat un model complet de tip random forest, vei explora importanța caracteristicilor.

Deși modelele random forest realizează selectarea caracteristicilor în mod natural — dar implicit — este adesea avantajos să construiești un model redus. Un model redus se antrenează mai rapid, calculează predicții mai repede și este mai ușor de înțeles și de gestionat. Desigur, există întotdeauna un compromis între simplitatea modelului și performanța acestuia.

În acest exercițiu, vei reduce setul de date. În exercițiul următor, vei antrena un model redus și vei compara performanța lui cu cea a modelului complet. rf_fit, train și test sunt deja disponibile.

Pachetele tidyverse, tidymodels și vip au fost încărcate pentru tine.

Instrucțiuni

100 XP
  • Folosește vi() cu parametrul rank pentru a extrage cele mai importante zece caracteristici.
  • Adaugă variabila țintă înapoi în lista celor mai importante caracteristici.
  • Aplică masca de caracteristici selectate pentru a reduce seturile de date.