Esplorare gli iperparametri di Random Forest
Capire quali iperparametri sono disponibili e l’impatto che hanno è una competenza fondamentale per ogni data scientist. Con l’aumentare della complessità dei modelli, le impostazioni possibili sono molte, ma solo alcune influenzeranno davvero il tuo modello.
Ora valuterai un modello random forest esistente (ha alcune scelte di iperparametri poco felici!) e poi farai scelte migliori per un nuovo modello random forest, per valutarne le prestazioni.
Avrai a disposizione:
- i DataFrame
X_train,X_test,y_train,y_test - Un estimatore random forest già addestrato,
rf_clf_old - Le predizioni dell’estimatore random forest esistente sul test set,
rf_old_predictions
Questo esercizio fa parte del corso
Ottimizzazione degli iperparametri in Python
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Print out the old estimator, notice which hyperparameter is badly set
print(____)
# Get confusion matrix & accuracy for the old rf_model
print("Confusion Matrix: \n\n {} \n Accuracy Score: \n\n {}".format(
confusion_matrix(____, ____),
accuracy_score(____, ____)))