Calculer la précision

Après avoir scindé vos données en ensembles d’entraînement et de test, vous pouvez maintenant ajuster votre modèle sur les données d’entraînement puis prédire les étiquettes des données de test. C’est ce que vous allez pratiquer dans cet exercice.

Jusqu’ici, vous avez utilisé la régression logistique et les arbres de décision. Ici, vous allez utiliser un RandomForestClassifier, que vous pouvez voir comme un ensemble d’arbres de décision qui surpasse généralement un arbre unique.

Votre travail dans les exercices précédents a été conservé, et les ensembles d’entraînement et de test sont disponibles dans les variables X_train, X_test, y_train et y_test.

Cet exercice fait partie du cours

<cours>Marketing Analytics : prédire l’attrition client en Python</cours>

Voir le cours

Instructions de l’exercice

Importez RandomForestClassifier depuis sklearn.ensemble.
Instanciez un RandomForestClassifier sous le nom clf.
Ajustez clf sur les données d’entraînement : X_train et y_train.
Calculez la précision de clf sur les données de test à l’aide de la méthode .score().

Exercice interactif pratique

Essayez cet exercice en complétant ce code d’exemple.

# Import RandomForestClassifier


# Instantiate the classifier
clf = ____

# Fit to the training data


# Compute accuracy
print(____.____(____, ____))

Modifier et exécuter le code