LoslegenKostenlos loslegen

Vorhersagen

Jetzt sagst du mit dem zuvor geschätzten Cox-Proportional-Hazard-Modell die Überlebenskurve für eine neue Kundin bzw. einen neuen Kunden voraus. Das Modell ist weiterhin im Objekt fitCPH verfügbar.

Die neue Kundin ist eine Frau und hat bei ihrer ersten Bestellung einen Gutschein verwendet (voucher = 1). Die Bestellung liegt 21 Tage zurück und hatte einen Warenkorbwert von 99,90 Dollar. Sie hat die Bestellung nicht zurückgeschickt (returned = 0).

Merke: voucher und returned können die Werte 0 oder 1 annehmen.

Diese Übung ist Teil des Kurses

Machine Learning für Marketing-Analytics in R

Kurs anzeigen

Anleitung zur Übung

  • Erstelle einen einzeiligen Dataframe namens newCustomer mit den oben im Aufgabentext genannten Merkmalen der neuen Kundin.
  • Sage die erwartete mediane Zeit bis zur zweiten Bestellung für diese Kundin mit print() voraus und plotte die vorhergesagte Überlebenskurve.
  • Du wirst informiert, dass aufgrund von Datenbankproblemen das Geschlecht falsch codiert wurde: Die neue Kundin ist tatsächlich ein Mann. Der Dataframe newCustomer wird in einen Dataframe namens newCustomer2 kopiert. Ändere nun die entsprechende Variable auf male.
  • Berechne den vorhergesagten Median mit den korrigierten Daten newCustomer2 erneut. Was hat sich geändert?

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Create data with new customer
___ <- data.frame(daysSinceFirstPurch = __, shoppingCartValue = ___, gender = "female", voucher = _, returned = _)

# Make predictions
pred <- survfit(fitCPH, newdata = ___)
print(___)
___(pred)

# Dataset is copied. Now correct the customer's gender there
newCustomer2 <- newCustomer
___$gender <- ___

# Redo prediction
pred2 <- ___(fitCPH, newdata = ___)
print(___)
Code bearbeiten und ausführen