ComeçarComece de graça

Dados para análise de sobrevivência

Nos próximos exercícios, você vai trabalhar com dados de clientes de uma loja online para praticar análise de sobrevivência. Mas agora não é sobre o tempo até o churn, e sim sobre o tempo até o segundo pedido.

Os dados estão armazenados no objeto dataNextOrder. A variável boughtAgain assume o valor 0 para clientes com apenas um pedido e 1 para clientes que já fizeram um segundo pedido. Se a pessoa fez um segundo pedido, você vê o número de dias entre o primeiro e o segundo pedido na variável daysSinceFirstPurch. Para clientes sem um segundo pedido, daysSinceFirstPurch contém o tempo desde o primeiro (e mais recente) pedido.

O pacote ggplot2 já está carregado no seu workspace.

Este exercício faz parte do curso

Machine Learning for Marketing Analytics in R

Ver curso

Instruções do exercício

  • Dê uma olhada nos dados usando head().
  • Faça um histograma dos dias desde a primeira compra separadamente para clientes com vs. sem um segundo pedido. (Se você não está acostumado ao código do ggplot2, não se preocupe: basta usar daysSinceFirstPurch como variável do eixo x e boughtAgain como variáveis de preenchimento e de faceta.)

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Look at the head of the data
___(dataNextOrder)

# Plot a histogram
ggplot(dataNextOrder) +
  geom_histogram(aes(x = ___,
                     fill = factor(___))) +
  facet_grid( ~ boughtAgain) + # Separate plots for boughtAgain = 1 vs. 0
  theme(legend.position = "none") # Don't show legend
Editar e executar o código