LoslegenKostenlos loslegen

Daten für die Survival-Analyse

In den folgenden Übungen arbeitest du mit Daten von Kundinnen und Kunden eines Onlineshops, um Survival-Analysen zu üben. Es geht diesmal nicht um die Zeit bis zum Churn, sondern um die Zeit bis zur zweiten Bestellung.

Die Daten liegen im Objekt dataNextOrder. Die Variable boughtAgain nimmt den Wert 0 für Kunden mit nur einer Bestellung und 1 für Kunden, die bereits ein zweites Mal bestellt haben. Wenn eine Person ein zweites Mal bestellt hat, siehst du in der Variable daysSinceFirstPurch die Anzahl der Tage zwischen der ersten und der zweiten Bestellung. Für Kundinnen und Kunden ohne zweite Bestellung enthält daysSinceFirstPurch die Zeit seit ihrer ersten (und aktuell letzten) Bestellung.

Das Paket ggplot2 ist bereits in deinem Workspace geladen.

Diese Übung ist Teil des Kurses

Machine Learning für Marketing-Analytics in R

Kurs anzeigen

Anleitung zur Übung

  • Verschaffe dir mit head() einen Überblick über die Daten.
  • Zeichne ein Histogramm der Tage seit dem ersten Kauf, getrennt nach Kundinnen und Kunden mit bzw. ohne zweite Bestellung. (Wenn du mit ggplot2-Code nicht so vertraut bist, keine Sorge: Du musst lediglich daysSinceFirstPurch als x-Variable und boughtAgain als Fill- und Facet-Variable verwenden.)

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Look at the head of the data
___(dataNextOrder)

# Plot a histogram
ggplot(dataNextOrder) +
  geom_histogram(aes(x = ___,
                     fill = factor(___))) +
  facet_grid( ~ boughtAgain) + # Separate plots for boughtAgain = 1 vs. 0
  theme(legend.position = "none") # Don't show legend
Code bearbeiten und ausführen