CommencerCommencer gratuitement

Prédictions de classification

En validation de modèle, il est souvent utile d’en savoir plus sur les prédictions que la simple classe finale. Par exemple, lorsqu’on prévoit qui va gagner un match, on s’intéresse aussi à la probabilité de victoire.

Probabilité Prédiction Signification
0 < .50 0 L’équipe perd
.50 + 1 L’équipe gagne

Dans cet exercice, vous allez utiliser les méthodes .predict() et .predict_proba() sur le jeu de données tic_tac_toe. La première renverra une prédiction indiquant si le Joueur 1 va gagner la partie, et la seconde fournira la probabilité que le Joueur 1 gagne. Utilisez rfc comme modèle de classification par forêt aléatoire.

Cet exercice fait partie du cours

Validation des modèles en Python

Afficher le cours

Instructions

  • Créez deux tableaux de prédictions : l’un pour les classes prédites et l’autre pour les probabilités prédites.
  • Utilisez la méthode .value_counts() d’une Series pandas pour afficher le nombre d’observations attribuées à chaque classe.
  • Affichez la première observation de probability_predictions pour voir la structure des probabilités.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Fit the rfc model. 
rfc.fit(X_train, y_train)

# Create arrays of predictions
classification_predictions = rfc.____(X_test)
probability_predictions = rfc.____(X_test)

# Print out count of binary predictions
print(pd.Series(____).____())

# Print the first value from probability_predictions
print('The first predicted probabilities are: {}'.format(____[____]))
Modifier et exécuter le code