L'oggetto RandomizedSearchCV

Proprio come la libreria GridSearchCV di Scikit Learn, RandomizedSearchCV offre molte funzionalità utili per eseguire in modo efficiente una ricerca casuale. Creerai un oggetto RandomizedSearchCV, apportando il piccolo aggiustamento necessario rispetto all'oggetto GridSearchCV.

Le opzioni desiderate sono:

Un Estimatore predefinito Gradient Boosting Classifier
Cross validation a 5 fold
Usa l'accuracy per valutare i modelli
Usa 4 core per l'elaborazione in parallelo
Assicurati di riadattare il modello migliore e restituire gli score di training
Campiona casualmente 10 modelli

La griglia degli iperparametri deve includere learning_rate (150 valori tra 0.1 e 2) e min_samples_leaf (tutti i valori tra 20 e 64 inclusi).

Avrai a disposizione gli insiemi di dati X_train e y_train.

Questo esercizio fa parte del corso

Ottimizzazione degli iperparametri in Python

Visualizza corso

Istruzioni dell'esercizio

Crea una griglia di parametri come specificato nel contesto sopra.
Crea un oggetto RandomizedSearchCV come descritto nel contesto sopra.
Adatta (fit) l'oggetto RandomizedSearchCV ai dati di training.
Stampa i valori scelti dal processo di modellazione per entrambi gli iperparametri.

esercizio interattivo pratico

Prova questo esercizio completando questo codice di esempio.

# Create the parameter grid
param_grid = {'learning_rate': np.linspace(____,____,150), 'min_samples_leaf': list(range(____,65))} 

# Create a random search object
random_GBM_class = ____(
    estimator = ____,
    ____ = param_grid,
    ____ = 10,
    scoring='____', n_jobs=____, cv = ____, refit=____, return_train_score = ____)

# Fit to the training data
random_GBM_class.fit(____, ____)

# Print the values used for both hyperparameters
print(random_GBM_class.____['param_learning_rate'])
print(random_GBM_class.cv_results_['____'])

Modifica ed esegui il codice

Questo esercizio fa parte del corso

Ottimizzazione degli iperparametri in Python

IntermediárioNível de habilidade

4.9+

Inizia il corso gratuitamente

In questo capitolo introduttivo imparerai la differenza tra iperparametri e parametri. Farai pratica nell’estrazione e analisi dei parametri e nell’impostare i valori degli iperparametri per diversi algoritmi di Machine Learning popolari. Lungo il percorso scoprirai consigli pratici e trucchi su quali iperparametri ottimizzare, quali valori provare e come costruire learning curve per analizzare le tue scelte.

Exercise 1: Introduzione e "Parametri"Exercise 2: Parametri nella Regressione Logistica Exercise 3: Estrazione di un parametro della Logistic Regression Exercise 4: Estrarre un parametro di Random Forest Exercise 5: Introduzione agli iperparametri Exercise 6: Iperparametri nei Random Forest Exercise 7: Esplorare gli iperparametri di Random Forest Exercise 8: Iperparametri di KNN Exercise 9: Impostare e analizzare i valori degli iperparametri Exercise 10: Automatizzare la scelta degli iperparametri Exercise 11: Costruire le learning curve

Questo capitolo ti presenta una metodologia molto usata per l’ottimizzazione automatica degli iperparametri chiamata Grid Search. Imparerai cos’è, come funziona e farai pratica a eseguire una Grid Search con Scikit Learn. Vedrai poi come analizzare l’output di una Grid Search e farai esperienza pratica nel farlo.

Exercise 1: Introduzione a Grid Search Exercise 2: Crea funzioni per la Grid Search Exercise 3: Ottimizza iterativamente più iperparametri Exercise 4: Quanti modelli?Exercise 5: Grid Search con Scikit Learn Exercise 6: Input di GridSearchCV Exercise 7: GridSearchCV con Scikit Learn Exercise 8: Capire l'output di una grid search Exercise 9: Usare i migliori risultati Exercise 10: Esplorare i risultati della grid search Exercise 11: Analizzare i risultati migliori Exercise 12: Usare i risultati migliori

In questo capitolo ti verrà presentata un’altra metodologia molto diffusa per l’ottimizzazione automatica degli iperparametri chiamata Random Search. Imparerai cos’è, come funziona e, soprattutto, in cosa differisce dalla grid search. Vedrai vantaggi e svantaggi di questo metodo e quando preferirlo rispetto alla Grid Search. Farai pratica a eseguire una Random Search con Scikit Learn e a visualizzare e interpretare l’output.

Exercise 1: Introduzione al Random Search Exercise 2: Campiona casualmente gli iperparametri Exercise 3: Ricerca casuale con Random Forest Exercise 4: Visualizzare una Random Search Exercise 5: Random Search in Scikit Learn Exercise 6: Input di RandomSearchCV Exercise 7: L'oggetto RandomizedSearchCV

Esercizio attuale

Exercise 8: RandomizedSearchCV in Scikit Learn Exercise 9: Confrontare Grid Search e Random Search Exercise 10: Confronto tra Random Search e Grid Search Exercise 11: Grid e Random Search a confronto

In questo capitolo finale assaggerai metodologie più avanzate di ottimizzazione degli iperparametri note come "informed search". Questo include un approccio detto Coarse To Fine e algoritmi di ottimizzazione Bayesiani e Genetici. Imparerai come l’informed search differisce dalla uninformed search e acquisirai abilità pratiche con ciascuna metodologia citata, confrontandole lungo il percorso.

Exercise 1: Ricerca informata: dal grossolano al fine Exercise 2: Visualizzare Coarse to Fine Exercise 3: Iterazioni Coarse to Fine Exercise 4: Ricerca informata: statistica bayesiana Exercise 5: La regola di Bayes in Python Exercise 6: Tuning bayesiano degli iperparametri con Hyperopt Exercise 7: Informed Search: Algoritmi genetici Exercise 8: Ottimizzazione genetica degli iperparametri con TPOT Exercise 9: Analizzare la stabilità di TPOT Exercise 10: Congratulazioni!