Aan de slagGa gratis aan de slag

Voorspellingen

Je gaat nu de overlevingscurve voorspellen voor een nieuwe klant met het Cox Proportional Hazard-model dat je eerder hebt geschat. Het model staat nog steeds in het object fitCPH.

De nieuwe klant is een vrouw en gebruikte een voucher bij haar eerste bestelling (voucher = 1). De bestelling is 21 dagen geleden geplaatst en had een winkelmandwaarde van 99,90 dollar. Ze heeft de bestelling niet geretourneerd (returned = 0).

Onthoud: voucher en returned kunnen de waarden 0 of 1 hebben.

Deze oefening maakt deel uit van de cursus

Machine Learning for Marketing Analytics in R

Cursus bekijken

Oefeninstructies

  • Maak een dataframe met één rij, newCustomer, met de kenmerken van de nieuwe klant zoals hierboven in de opdrachttekst vermeld.
  • Voorspel de verwachte mediane tijd tot de tweede bestelling voor deze klant met print() en plot de voorspelde overlevingscurve.
  • Je hoort dat door databaseproblemen het geslacht verkeerd is gecodeerd: de nieuwe klant is eigenlijk een man. De dataframe newCustomer is gekopieerd naar een dataframe newCustomer2. Pas nu de betreffende variabele aan naar male.
  • Bereken de voorspelde mediaan opnieuw met de gecorrigeerde data newCustomer2. Wat is er veranderd?

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Create data with new customer
___ <- data.frame(daysSinceFirstPurch = __, shoppingCartValue = ___, gender = "female", voucher = _, returned = _)

# Make predictions
pred <- survfit(fitCPH, newdata = ___)
print(___)
___(pred)

# Dataset is copied. Now correct the customer's gender there
newCustomer2 <- newCustomer
___$gender <- ___

# Redo prediction
pred2 <- ___(fitCPH, newdata = ___)
print(___)
Code bewerken en uitvoeren