Aan de slagGa gratis aan de slag

Data voor survivalanalyse

In de volgende oefeningen ga je werken met data over klanten van een online shop om survivalanalyse te oefenen. Het gaat nu niet om de tijd tot churn, maar om de tijd tot de tweede bestelling.

De data staat in het object dataNextOrder. De variabele boughtAgain heeft de waarde 0 voor klanten met slechts één bestelling en 1 voor klanten die al een tweede bestelling hebben geplaatst. Als iemand een tweede keer heeft besteld, zie je het aantal dagen tussen de eerste en tweede bestelling in de variabele daysSinceFirstPurch. Voor klanten zonder tweede bestelling bevat daysSinceFirstPurch de tijd sinds hun eerste (en meest recente) bestelling.

Het pakket ggplot2 is al in je werkruimte geladen.

Deze oefening maakt deel uit van de cursus

Machine Learning for Marketing Analytics in R

Cursus bekijken

Oefeninstructies

  • Bekijk de data met head().
  • Plot een histogram van het aantal dagen sinds de eerste aankoop, apart voor klanten met en zonder een tweede bestelling. (Als je niet vertrouwd bent met ggplot2-code, geen zorgen: je hoeft alleen daysSinceFirstPurch als x-variabele te gebruiken en boughtAgain als fill- en facet-variabele.)

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Look at the head of the data
___(dataNextOrder)

# Plot a histogram
ggplot(dataNextOrder) +
  geom_histogram(aes(x = ___,
                     fill = factor(___))) +
  facet_grid( ~ boughtAgain) + # Separate plots for boughtAgain = 1 vs. 0
  theme(legend.position = "none") # Don't show legend
Code bewerken en uitvoeren