1. Learn
  2. /
  3. Cursuri
  4. /
  5. Marketing Analytics: Predicția abandonului clienților în Python

Connected

exercițiu

Ajustarea numărului de caracteristici

Hiperparametrii impliciți folosiți de modele nu sunt optimizați pentru datele tale. Scopul validării încrucișate prin căutare pe grilă este de a identifica hiperparametrii care conduc la performanța optimă a modelului. În videoclip, ai văzut cum a fost ajustat hiperparametrul n_estimators al pădurii aleatoare. Aici vei exersa ajustarea hiperparametrului max_features. Hiperparametrul cv este setat la 3 pentru ca execuția codului să fie rapidă.

Hiperparametru Scop
max_features Numărul de caracteristici pentru cea mai bună divizare

O pădure aleatoare este un ansamblu de mulți arbori de decizie. Hiperparametrul n_estimators controlează numărul de arbori folosiți în pădure, iar hiperparametrul max_features controlează numărul de caracteristici pe care pădurea aleatoare le ia în considerare atunci când caută cea mai bună divizare în arborele de decizie.

A fost instanțiat pentru tine un clasificator de tip pădure aleatoare, sub numele clf.

Instrucțiuni 1/4

undefined XP
    1
    2
    3
    4
  • Importă GridSearchCV din sklearn.model_selection.