Random Forest Classifier - partie 1
Créons maintenant un premier random forest classifier pour détecter la fraude. Avec un peu de chance, vous ferez mieux que la précision de référence que vous venez de calculer, qui était d’environ 96 %. Ce modèle servira de modèle « baseline » que vous chercherez à améliorer dans les prochains exercices. Commençons par séparer les données en jeu de test et jeu d’entraînement, puis définir le modèle Random Forest. Les données disponibles sont les variables explicatives X et les étiquettes y.
Cet exercice fait partie du cours
Détection de fraude en Python
Instructions
- Importez le classifieur Random Forest depuis
sklearn. - Séparez vos variables explicatives
Xet vos étiquettesyen jeux d’entraînement et de test. Réservez 30 % pour le jeu de test. - Affectez le classifieur Random Forest à
modelet laissezrandom_stateà 5. Il faut fixer une graine aléatoire ici afin de pouvoir comparer les résultats entre différents modèles.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Import the random forest model from sklearn
from sklearn.ensemble import ____
# Split your data into training and test set
X_train, X_test, y_train, y_test = ____(____, ____, test_size=____, random_state=0)
# Define the model as the random forest
model = ____(random_state=5)