IniziaInizia gratis

Valutare Random Forest

In questo esercizio finale valuterai i risultati della cross-validation su un modello Random Forest.

Sono già stati creati:

  • cv - un cross-validator già addestrato sui dati di training
  • evaluator — un oggetto BinaryClassificationEvaluator e
  • flights_test — i dati di test.

Questo esercizio fa parte del corso

Machine Learning con PySpark

Visualizza il corso

Istruzioni dell'esercizio

  • Stampa l'elenco delle AUC medie per tutti i modelli nella griglia dei parametri.
  • Mostra l'AUC media del modello migliore. Sarà la AUC più alta della lista.
  • Stampa una spiegazione dei parametri maxDepth e featureSubsetStrategy per il modello migliore.
  • Mostra l'AUC per le predizioni del modello migliore sui dati di test.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Average AUC for each parameter combination in grid
print(cv.____)

# Average AUC for the best model
print(____(____))

# What's the optimal parameter value for maxDepth?
print(cv.____.explainParam('____'))
# What's the optimal parameter value for featureSubsetStrategy?
print(cv.____.____(____))

# AUC for best model on testing data
print(evaluator.____(____.____(____)))
Modifica ed esegui il codice