Valutare Random Forest
In questo esercizio finale valuterai i risultati della cross-validation su un modello Random Forest.
Sono già stati creati:
cv- un cross-validator già addestrato sui dati di trainingevaluator— un oggettoBinaryClassificationEvaluatoreflights_test— i dati di test.
Questo esercizio fa parte del corso
Machine Learning con PySpark
Istruzioni dell'esercizio
- Stampa l'elenco delle AUC medie per tutti i modelli nella griglia dei parametri.
- Mostra l'AUC media del modello migliore. Sarà la AUC più alta della lista.
- Stampa una spiegazione dei parametri
maxDepthefeatureSubsetStrategyper il modello migliore. - Mostra l'AUC per le predizioni del modello migliore sui dati di test.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Average AUC for each parameter combination in grid
print(cv.____)
# Average AUC for the best model
print(____(____))
# What's the optimal parameter value for maxDepth?
print(cv.____.explainParam('____'))
# What's the optimal parameter value for featureSubsetStrategy?
print(cv.____.____(____))
# AUC for best model on testing data
print(evaluator.____(____.____(____)))