CommencerCommencer gratuitement

Évaluation de Random Forest

Dans ce dernier exercice, vous évaluerez les résultats de la validation croisée sur un modèle Random Forest.

Les éléments suivants ont déjà été créés :

  • cv - un validateur croisé qui a déjà été ajusté aux données d'apprentissage
  • evaluator - un objet BinaryClassificationEvaluator et
  • flights_test - les données d'essai.

Cet exercice fait partie du cours

Apprentissage automatique avec PySpark

Afficher le cours

Instructions

  • Imprime une liste des mesures moyennes de la SSC pour tous les modèles de la grille de paramètres.
  • Affichez l'AUC moyenne pour le meilleur modèle. Il s'agit de la plus grande CUA de la liste.
  • Imprimez une explication des paramètres maxDepth et featureSubsetStrategy pour le meilleur modèle.
  • Affichez l'AUC pour les meilleures prédictions du modèle sur les données de test.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Average AUC for each parameter combination in grid
print(cv.____)

# Average AUC for the best model
print(____(____))

# What's the optimal parameter value for maxDepth?
print(cv.____.explainParam('____'))
# What's the optimal parameter value for featureSubsetStrategy?
print(cv.____.____(____))

# AUC for best model on testing data
print(evaluator.____(____.____(____)))
Modifier et exécuter le code