Random Forest Classifier - partie 1

Créons maintenant un premier random forest classifier pour détecter la fraude. Avec un peu de chance, vous ferez mieux que la précision de référence que vous venez de calculer, qui était d’environ 96 %. Ce modèle servira de modèle « baseline » que vous chercherez à améliorer dans les prochains exercices. Commençons par séparer les données en jeu de test et jeu d’entraînement, puis définir le modèle Random Forest. Les données disponibles sont les variables explicatives X et les étiquettes y.

Cet exercice fait partie du cours

<cours>Détection de fraude en Python</cours>

Voir le cours

Instructions de l’exercice

Importez le classifieur Random Forest depuis sklearn.
Séparez vos variables explicatives X et vos étiquettes y en jeux d’entraînement et de test. Réservez 30 % pour le jeu de test.
Affectez le classifieur Random Forest à model et laissez random_state à 5. Il faut fixer une graine aléatoire ici afin de pouvoir comparer les résultats entre différents modèles.

Exercice interactif pratique

Essayez cet exercice en complétant ce code d’exemple.

# Import the random forest model from sklearn
from sklearn.ensemble import ____

# Split your data into training and test set
X_train, X_test, y_train, y_test = ____(____, ____, test_size=____, random_state=0)

# Define the model as the random forest
model = ____(random_state=5)

Modifier et exécuter le code