Dati per l'analisi di sopravvivenza
Nei prossimi esercizi lavorerai con i dati dei clienti di un negozio online per esercitarti con l'analisi di sopravvivenza. Questa volta, però, non ci interessa il tempo fino al churn, ma il tempo fino al secondo ordine.
I dati sono memorizzati nell'oggetto dataNextOrder. La variabile boughtAgain assume il valore 0 per i clienti con un solo ordine e 1 per i clienti che hanno già effettuato un secondo ordine. Se una persona ha ordinato una seconda volta, nella variabile daysSinceFirstPurch trovi il numero di giorni tra il primo e il secondo ordine. Per i clienti senza un secondo ordine, daysSinceFirstPurch contiene il tempo trascorso dal loro primo (e più recente) ordine.
Il pacchetto ggplot2 è già caricato nel tuo workspace.
Questo esercizio fa parte del corso
Machine Learning per il Marketing Analytics in R
Istruzioni dell'esercizio
- Dai un'occhiata ai dati usando
head(). - Disegna un istogramma dei giorni dal primo acquisto separatamente per i clienti con e senza un secondo ordine. (Se non sei abituato al codice di
ggplot2, nessun problema: ti basta usaredaysSinceFirstPurchcome variabile x eboughtAgaincome variabile di riempimento e di faceting.)
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Look at the head of the data
___(dataNextOrder)
# Plot a histogram
ggplot(dataNextOrder) +
geom_histogram(aes(x = ___,
fill = factor(___))) +
facet_grid( ~ boughtAgain) + # Separate plots for boughtAgain = 1 vs. 0
theme(legend.position = "none") # Don't show legend