Prédictions de classification
En validation de modèle, il est souvent utile d’en savoir plus sur les prédictions que la simple classe finale. Par exemple, lorsqu’on prévoit qui va gagner un match, on s’intéresse aussi à la probabilité de victoire.
| Probabilité | Prédiction | Signification |
|---|---|---|
| 0 < .50 | 0 | L’équipe perd |
| .50 + | 1 | L’équipe gagne |
Dans cet exercice, vous allez utiliser les méthodes .predict() et .predict_proba() sur le jeu de données tic_tac_toe. La première renverra une prédiction indiquant si le Joueur 1 va gagner la partie, et la seconde fournira la probabilité que le Joueur 1 gagne. Utilisez rfc comme modèle de classification par forêt aléatoire.
Cet exercice fait partie du cours
Validation des modèles en Python
Instructions
- Créez deux tableaux de prédictions : l’un pour les classes prédites et l’autre pour les probabilités prédites.
- Utilisez la méthode
.value_counts()d’une Series pandas pour afficher le nombre d’observations attribuées à chaque classe. - Affichez la première observation de
probability_predictionspour voir la structure des probabilités.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Fit the rfc model.
rfc.fit(X_train, y_train)
# Create arrays of predictions
classification_predictions = rfc.____(X_test)
probability_predictions = rfc.____(X_test)
# Print out count of binary predictions
print(pd.Series(____).____())
# Print the first value from probability_predictions
print('The first predicted probabilities are: {}'.format(____[____]))