IniziaInizia gratis

Dati per l'analisi di sopravvivenza

Nei prossimi esercizi lavorerai con i dati dei clienti di un negozio online per esercitarti con l'analisi di sopravvivenza. Questa volta, però, non ci interessa il tempo fino al churn, ma il tempo fino al secondo ordine.

I dati sono memorizzati nell'oggetto dataNextOrder. La variabile boughtAgain assume il valore 0 per i clienti con un solo ordine e 1 per i clienti che hanno già effettuato un secondo ordine. Se una persona ha ordinato una seconda volta, nella variabile daysSinceFirstPurch trovi il numero di giorni tra il primo e il secondo ordine. Per i clienti senza un secondo ordine, daysSinceFirstPurch contiene il tempo trascorso dal loro primo (e più recente) ordine.

Il pacchetto ggplot2 è già caricato nel tuo workspace.

Questo esercizio fa parte del corso

Machine Learning per il Marketing Analytics in R

Visualizza il corso

Istruzioni dell'esercizio

  • Dai un'occhiata ai dati usando head().
  • Disegna un istogramma dei giorni dal primo acquisto separatamente per i clienti con e senza un secondo ordine. (Se non sei abituato al codice di ggplot2, nessun problema: ti basta usare daysSinceFirstPurch come variabile x e boughtAgain come variabile di riempimento e di faceting.)

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Look at the head of the data
___(dataNextOrder)

# Plot a histogram
ggplot(dataNextOrder) +
  geom_histogram(aes(x = ___,
                     fill = factor(___))) +
  facet_grid( ~ boughtAgain) + # Separate plots for boughtAgain = 1 vs. 0
  theme(legend.position = "none") # Don't show legend
Modifica ed esegui il codice