Data voor survivalanalyse
In de volgende oefeningen ga je werken met data over klanten van een online shop om survivalanalyse te oefenen. Het gaat nu niet om de tijd tot churn, maar om de tijd tot de tweede bestelling.
De data staat in het object dataNextOrder. De variabele boughtAgain heeft de waarde 0 voor klanten met slechts één bestelling en 1 voor klanten die al een tweede bestelling hebben geplaatst. Als iemand een tweede keer heeft besteld, zie je het aantal dagen tussen de eerste en tweede bestelling in de variabele daysSinceFirstPurch. Voor klanten zonder tweede bestelling bevat daysSinceFirstPurch de tijd sinds hun eerste (en meest recente) bestelling.
Het pakket ggplot2 is al in je werkruimte geladen.
Deze oefening maakt deel uit van de cursus
Machine Learning for Marketing Analytics in R
Oefeninstructies
- Bekijk de data met
head(). - Plot een histogram van het aantal dagen sinds de eerste aankoop, apart voor klanten met en zonder een tweede bestelling. (Als je niet vertrouwd bent met
ggplot2-code, geen zorgen: je hoeft alleendaysSinceFirstPurchals x-variabele te gebruiken enboughtAgainals fill- en facet-variabele.)
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Look at the head of the data
___(dataNextOrder)
# Plot a histogram
ggplot(dataNextOrder) +
geom_histogram(aes(x = ___,
fill = factor(___))) +
facet_grid( ~ boughtAgain) + # Separate plots for boughtAgain = 1 vs. 0
theme(legend.position = "none") # Don't show legend