Vorhersagen
Jetzt sagst du mit dem zuvor geschätzten Cox-Proportional-Hazard-Modell die Überlebenskurve für eine neue Kundin bzw. einen neuen Kunden voraus. Das Modell ist weiterhin im Objekt fitCPH verfügbar.
Die neue Kundin ist eine Frau und hat bei ihrer ersten Bestellung einen Gutschein verwendet (voucher = 1). Die Bestellung liegt 21 Tage zurück und hatte einen Warenkorbwert von 99,90 Dollar. Sie hat die Bestellung nicht zurückgeschickt (returned = 0).
Merke: voucher und returned können die Werte 0 oder 1 annehmen.
Diese Übung ist Teil des Kurses
Machine Learning für Marketing-Analytics in R
Anleitung zur Übung
- Erstelle einen einzeiligen Dataframe namens
newCustomermit den oben im Aufgabentext genannten Merkmalen der neuen Kundin. - Sage die erwartete mediane Zeit bis zur zweiten Bestellung für diese Kundin mit
print()voraus und plotte die vorhergesagte Überlebenskurve. - Du wirst informiert, dass aufgrund von Datenbankproblemen das Geschlecht falsch codiert wurde: Die neue Kundin ist tatsächlich ein Mann. Der Dataframe
newCustomerwird in einen Dataframe namensnewCustomer2kopiert. Ändere nun die entsprechende Variable aufmale. - Berechne den vorhergesagten Median mit den korrigierten Daten
newCustomer2erneut. Was hat sich geändert?
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Create data with new customer
___ <- data.frame(daysSinceFirstPurch = __, shoppingCartValue = ___, gender = "female", voucher = _, returned = _)
# Make predictions
pred <- survfit(fitCPH, newdata = ___)
print(___)
___(pred)
# Dataset is copied. Now correct the customer's gender there
newCustomer2 <- newCustomer
___$gender <- ___
# Redo prediction
pred2 <- ___(fitCPH, newdata = ___)
print(___)