Daten für die Survival-Analyse
In den folgenden Übungen arbeitest du mit Daten von Kundinnen und Kunden eines Onlineshops, um Survival-Analysen zu üben. Es geht diesmal nicht um die Zeit bis zum Churn, sondern um die Zeit bis zur zweiten Bestellung.
Die Daten liegen im Objekt dataNextOrder. Die Variable boughtAgain nimmt den Wert 0 für Kunden mit nur einer Bestellung und 1 für Kunden, die bereits ein zweites Mal bestellt haben. Wenn eine Person ein zweites Mal bestellt hat, siehst du in der Variable daysSinceFirstPurch die Anzahl der Tage zwischen der ersten und der zweiten Bestellung. Für Kundinnen und Kunden ohne zweite Bestellung enthält daysSinceFirstPurch die Zeit seit ihrer ersten (und aktuell letzten) Bestellung.
Das Paket ggplot2 ist bereits in deinem Workspace geladen.
Diese Übung ist Teil des Kurses
Machine Learning für Marketing-Analytics in R
Anleitung zur Übung
- Verschaffe dir mit
head()einen Überblick über die Daten. - Zeichne ein Histogramm der Tage seit dem ersten Kauf, getrennt nach Kundinnen und Kunden mit bzw. ohne zweite Bestellung. (Wenn du mit
ggplot2-Code nicht so vertraut bist, keine Sorge: Du musst lediglichdaysSinceFirstPurchals x-Variable undboughtAgainals Fill- und Facet-Variable verwenden.)
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Look at the head of the data
___(dataNextOrder)
# Plot a histogram
ggplot(dataNextOrder) +
geom_histogram(aes(x = ___,
fill = factor(___))) +
facet_grid( ~ boughtAgain) + # Separate plots for boughtAgain = 1 vs. 0
theme(legend.position = "none") # Don't show legend