Évaluation de Random Forest

Dans ce dernier exercice, vous évaluerez les résultats de la validation croisée sur un modèle Random Forest.

Les éléments suivants ont déjà été créés :

cv - un validateur croisé qui a déjà été ajusté aux données d'apprentissage
evaluator - un objet BinaryClassificationEvaluator et
flights_test - les données d'essai.

Cet exercice fait partie du cours

Apprentissage automatique avec PySpark

Afficher le cours

Instructions

Imprime une liste des mesures moyennes de la SSC pour tous les modèles de la grille de paramètres.
Affichez l'AUC moyenne pour le meilleur modèle. Il s'agit de la plus grande CUA de la liste.
Imprimez une explication des paramètres maxDepth et featureSubsetStrategy pour le meilleur modèle.
Affichez l'AUC pour les meilleures prédictions du modèle sur les données de test.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Average AUC for each parameter combination in grid
print(cv.____)

# Average AUC for the best model
print(____(____))

# What's the optimal parameter value for maxDepth?
print(cv.____.explainParam('____'))
# What's the optimal parameter value for featureSubsetStrategy?
print(cv.____.____(____))

# AUC for best model on testing data
print(evaluator.____(____.____(____)))

Modifier et exécuter le code