Vorhersagen
Jetzt sagst du mit dem zuvor geschätzten Cox-Proportional-Hazard-Modell die Überlebenskurve für eine neue Kundin bzw. einen neuen Kunden voraus. Das Modell ist weiterhin im Objekt fitCPH verfügbar.
Die neue Kundin ist eine Frau und hat bei ihrer ersten Bestellung einen Gutschein verwendet (voucher = 1). Die Bestellung liegt 21 Tage zurück und hatte einen Warenkorbwert von 99,90 Dollar. Sie hat die Bestellung nicht zurückgeschickt (returned = 0).
Merke: voucher und returned können die Werte 0 oder 1 annehmen.
Diese Übung ist Teil des Kurses
<Kurs>Machine Learning für Marketing-Analytics in R</Kurs>Übungsanweisungen
- Erstelle einen einzeiligen Dataframe namens
newCustomermit den oben im Aufgabentext genannten Merkmalen der neuen Kundin. - Sage die erwartete mediane Zeit bis zur zweiten Bestellung für diese Kundin mit
print()voraus und plotte die vorhergesagte Überlebenskurve. - Du wirst informiert, dass aufgrund von Datenbankproblemen das Geschlecht falsch codiert wurde: Die neue Kundin ist tatsächlich ein Mann. Der Dataframe
newCustomerwird in einen Dataframe namensnewCustomer2kopiert. Ändere nun die entsprechende Variable aufmale. - Berechne den vorhergesagten Median mit den korrigierten Daten
newCustomer2erneut. Was hat sich geändert?
Interaktive praktische Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
# Create data with new customer
___ <- data.frame(daysSinceFirstPurch = __, shoppingCartValue = ___, gender = "female", voucher = _, returned = _)
# Make predictions
pred <- survfit(fitCPH, newdata = ___)
print(___)
___(pred)
# Dataset is copied. Now correct the customer's gender there
newCustomer2 <- newCustomer
___$gender <- ___
# Redo prediction
pred2 <- ___(fitCPH, newdata = ___)
print(___)