Een geavanceerder model bouwen
Een van de beste voorspellers van toekomstige donaties is een geschiedenis met recente, frequente en grote giften. In marketingtermen heet dit R/F/M:
- Recency
- Frequency
- Money
Donateurs die niet zowel recent als vaak hebben gegeven, zijn mogelijk juist extra geneigd om opnieuw te geven; met andere woorden, de gecombineerde impact van recency en frequency kan groter zijn dan de som van de afzonderlijke effecten.
Omdat deze voorspellers samen een grotere invloed hebben op de afhankelijke variabele, moet hun gezamenlijke effect worden gemodelleerd als een interactie. De gegevensset donors is al voor je geladen.
Deze oefening maakt deel uit van de cursus
Supervised Learning in R: Classificatie
Oefeninstructies
- Maak een logistisch regressiemodel van
donatedals functie vanmoneyplus de interactie vanrecencyenfrequency. Gebruik*om de interactieterm toe te voegen. - Bekijk de
summary()van het model om te bevestigen dat het interactie-effect is toegevoegd. - Sla de voorspelde waarschijnlijkheden van het model op als
rfm_prob. Gebruik de functiepredict()en vergeet niet het argumenttypete zetten. - Plot een ROC-curve met de functie
roc(). Denk eraan: deze functie neemt de kolom met uitkomsten en de vector met voorspellingen. - Bereken de AUC voor het nieuwe model met de functie
auc()en vergelijk de prestaties met het eenvoudigere model.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Build a recency, frequency, and money (RFM) model
rfm_model <- ___
# Summarize the RFM model to see how the parameters were coded
# Compute predicted probabilities for the RFM model
rfm_prob <- ___
# Plot the ROC curve and find AUC for the new model
library(pROC)
ROC <- ___
plot(___, col = "red")
auc(___)