Calculer la précision
Après avoir scindé vos données en ensembles d’entraînement et de test, vous pouvez maintenant ajuster votre modèle sur les données d’entraînement puis prédire les étiquettes des données de test. C’est ce que vous allez pratiquer dans cet exercice.
Jusqu’ici, vous avez utilisé la régression logistique et les arbres de décision. Ici, vous allez utiliser un RandomForestClassifier, que vous pouvez voir comme un ensemble d’arbres de décision qui surpasse généralement un arbre unique.
Votre travail dans les exercices précédents a été conservé, et les ensembles d’entraînement et de test sont disponibles dans les variables X_train, X_test, y_train et y_test.
Cet exercice fait partie du cours
Marketing Analytics : prédire l’attrition client en Python
Instructions
- Importez
RandomForestClassifierdepuissklearn.ensemble. - Instanciez un
RandomForestClassifiersous le nomclf. - Ajustez
clfsur les données d’entraînement :X_trainety_train. - Calculez la précision de
clfsur les données de test à l’aide de la méthode.score().
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Import RandomForestClassifier
# Instantiate the classifier
clf = ____
# Fit to the training data
# Compute accuracy
print(____.____(____, ____))