1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Marketing Analytics: Predicting Customer Churn in Python

Connected

cvičení

Randomizované prohledávání

# Call GridSearchCV
grid_search = GridSearchCV(clf, param_grid)

# Fit the model
grid_search.fit(X, y)

V předchozím cvičení sis možná všiml/a, že první řádek kódu proběhl téměř okamžitě, zatímco volání .fit() trvalo několik sekund.

Důvod je jednoduchý: .fit() je to, co skutečně spouští grid search, a v našem případě šlo o mřížku s mnoha různými kombinacemi. Čím větší hyperparametrická mřížka, tím pomalejší prohledávání. Aby se tento problém vyřešil, místo zkoušení každé jednotlivé kombinace hodnot můžeme mřížkou procházet náhodně a testovat různé kombinace. Existuje malá šance, že přehlédneme tu nejlepší kombinaci, ale ušetříme spoustu času – nebo dokážeme ladit více hyperparametrů za stejnou dobu.

V scikit-learn k tomu slouží RandomizedSearchCV. Má stejné API jako GridSearchCV, jen místo konkrétních hodnot hyperparametrů zadáváš distribuci parametrů, ze které se vzorkuje. Pojďme to vyzkoušet! Distribuce parametrů je už připravená, stejně jako klasifikátor náhodného lesa clf.

Pokyny 1/3

undefined XP
    1
    2
    3
  • Importuj RandomizedSearchCV z sklearn.model_selection.