1. Learn
  2. /
  3. Cursuri
  4. /
  5. Reducerea dimensionalității în Python

Connected

exercițiu

Construirea unui model de pădure aleatorie

Vei lucra din nou pe setul de date Pima Indians pentru a prezice dacă o persoană are diabet – de data aceasta folosind un clasificator de tip pădure aleatorie (random forest). Vei antrena modelul pe datele de antrenament după împărțirea train-test și vei analiza valorile de importanță ale caracteristicilor.

Seturile de caracteristici și țintă au fost pre-încărcate ca X și y. La fel și pachetele și funcțiile necesare.

Instrucțiuni

100 XP
  • Setează o proporție de 25% pentru testare, realizând o împărțire train-test de 75%-25%.
  • Antrenează clasificatorul de tip pădure aleatorie pe datele de antrenament.
  • Calculează acuratețea pe setul de testare.
  • Afișează importanța fiecărei caracteristici.