Construire un modèle plus sophistiqué
L'un des meilleurs indicateurs des dons futurs est l'historique des dons récents, fréquents et importants. En termes de marketing, on parle de R/F/M :
- Récence
- Fréquence
- L'argent
Les donateurs qui n'ont pas donné récemment et fréquemment peuvent être particulièrement susceptibles de donner à nouveau ; en d'autres termes, l'impact combiné de la récurrence et de la fréquence peut être plus important que la somme des effets séparés.
Comme ces prédicteurs ont ensemble un impact plus important sur la variable dépendante, leur effet conjoint doit être modélisé comme une interaction. L'ensemble de données donors
a été chargé pour vous.
Cet exercice fait partie du cours
Apprentissage supervisé en R : Classification
Instructions
- Créez un modèle de régression logistique de
donated
en fonction demoney
et de l'interaction entrerecency
etfrequency
. Utilisez*
pour ajouter le terme d'interaction. - Examinez le site
summary()
du modèle pour confirmer que l'effet d'interaction a été ajouté. - Enregistrez les probabilités prédites par le modèle à l'adresse
rfm_prob
. Utilisez la fonctionpredict()
et n'oubliez pas de définir l'argumenttype
. - Tracez une courbe ROC en utilisant la fonction
roc()
. N'oubliez pas que cette fonction prend la colonne des résultats et le vecteur des prédictions. - Calculez le site AUC pour le nouveau modèle à l'aide de la fonction
auc()
et comparez sa performance à celle du modèle plus simple.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Build a recency, frequency, and money (RFM) model
rfm_model <- ___
# Summarize the RFM model to see how the parameters were coded
# Compute predicted probabilities for the RFM model
rfm_prob <- ___
# Plot the ROC curve and find AUC for the new model
library(pROC)
ROC <- ___
plot(___, col = "red")
auc(___)