Dados para análise de sobrevivência
Nos próximos exercícios, você vai trabalhar com dados de clientes de uma loja online para praticar análise de sobrevivência. Mas agora não é sobre o tempo até o churn, e sim sobre o tempo até o segundo pedido.
Os dados estão armazenados no objeto dataNextOrder. A variável boughtAgain assume o valor 0 para clientes com apenas um pedido e 1 para clientes que já fizeram um segundo pedido. Se a pessoa fez um segundo pedido, você vê o número de dias entre o primeiro e o segundo pedido na variável daysSinceFirstPurch. Para clientes sem um segundo pedido, daysSinceFirstPurch contém o tempo desde o primeiro (e mais recente) pedido.
O pacote ggplot2 já está carregado no seu workspace.
Este exercício faz parte do curso
Machine Learning for Marketing Analytics in R
Instruções do exercício
- Dê uma olhada nos dados usando
head(). - Faça um histograma dos dias desde a primeira compra separadamente para clientes com vs. sem um segundo pedido. (Se você não está acostumado ao código do
ggplot2, não se preocupe: basta usardaysSinceFirstPurchcomo variável do eixo x eboughtAgaincomo variáveis de preenchimento e de faceta.)
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Look at the head of the data
___(dataNextOrder)
# Plot a histogram
ggplot(dataNextOrder) +
geom_histogram(aes(x = ___,
fill = factor(___))) +
facet_grid( ~ boughtAgain) + # Separate plots for boughtAgain = 1 vs. 0
theme(legend.position = "none") # Don't show legend