Créez votre propre modèle de détection
Regroupons les outils vus dans ce chapitre. Le jeu de données de virements bancaires des exercices précédents a été séparé en un ensemble d’entraînement et un ensemble de test avec le même déséquilibre de classes. Ensuite, SMOTE a été appliqué sur l’ensemble d’entraînement. Vous allez entraîner un arbre de classification sur l’ensemble d’entraînement initial déséquilibré et sur l’ensemble ré-équilibré. Enfin, les deux modèles seront comparés sur le même ensemble de test.
Les bibliothèques rpart et caret sont déjà chargées dans votre espace de travail. N’hésitez pas à vous référer au diaporama pour réaliser cet exercice.
Cet exercice fait partie du cours
Détection de fraude en R
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Train the rpart algorithm on the original training set and the SMOTE-rebalanced training set
model_orig <- ___(___, data = ___)
model_smote <- ___(___, data = ___)