Voorspellingen
Je gaat nu de overlevingscurve voorspellen voor een nieuwe klant met het Cox Proportional Hazard-model dat je eerder hebt geschat. Het model staat nog steeds in het object fitCPH.
De nieuwe klant is een vrouw en gebruikte een voucher bij haar eerste bestelling (voucher = 1). De bestelling is 21 dagen geleden geplaatst en had een winkelmandwaarde van 99,90 dollar. Ze heeft de bestelling niet geretourneerd (returned = 0).
Onthoud: voucher en returned kunnen de waarden 0 of 1 hebben.
Deze oefening maakt deel uit van de cursus
Machine Learning for Marketing Analytics in R
Oefeninstructies
- Maak een dataframe met één rij,
newCustomer, met de kenmerken van de nieuwe klant zoals hierboven in de opdrachttekst vermeld. - Voorspel de verwachte mediane tijd tot de tweede bestelling voor deze klant met
print()en plot de voorspelde overlevingscurve. - Je hoort dat door databaseproblemen het geslacht verkeerd is gecodeerd: de nieuwe klant is eigenlijk een man. De dataframe
newCustomeris gekopieerd naar een dataframenewCustomer2. Pas nu de betreffende variabele aan naarmale. - Bereken de voorspelde mediaan opnieuw met de gecorrigeerde data
newCustomer2. Wat is er veranderd?
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Create data with new customer
___ <- data.frame(daysSinceFirstPurch = __, shoppingCartValue = ___, gender = "female", voucher = _, returned = _)
# Make predictions
pred <- survfit(fitCPH, newdata = ___)
print(___)
___(pred)
# Dataset is copied. Now correct the customer's gender there
newCustomer2 <- newCustomer
___$gender <- ___
# Redo prediction
pred2 <- ___(fitCPH, newdata = ___)
print(___)