1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Marketing Analytics: Predicting Customer Churn in Python

Connected

cvičení

Ladění počtu příznaků

Výchozí hyperparametry tvých modelů nejsou optimalizované pro tvá data. Cílem křížové validace s prohledáváním mřížky (grid search) je najít takové hyperparametry, které vedou k nejlepšímu výkonu modelu. Ve videu jsi viděl/a, jak se ladil hyperparametr n_estimators náhodného lesa. Teď si procvičíš ladění hyperparametru max_features. Hyperparametr cv je nastaven na 3, aby kód běžel rychle.

Hyperparametr Účel
max_features Počet příznaků pro nejlepší rozdělení

Náhodný les je ansámbl mnoha rozhodovacích stromů. Hyperparametr n_estimators určuje počet stromů v lese, zatímco hyperparametr max_features říká, kolik příznaků má náhodný les zvažovat při hledání nejlepšího rozdělení v rozhodovacím stromě.

Klasifikátor náhodného lesa je pro tebe už připravený jako clf.

Pokyny 1/4

undefined XP
    1
    2
    3
    4
  • Importuj GridSearchCV z sklearn.model_selection.