Data untuk survival analysis
Pada latihan berikut, Anda akan bekerja dengan data pelanggan sebuah toko online untuk berlatih survival analysis. Namun kali ini bukan tentang waktu hingga churn, melainkan waktu hingga pesanan kedua.
Data disimpan dalam objek dataNextOrder. Variabel boughtAgain bernilai 0 untuk pelanggan dengan hanya satu pesanan dan 1 untuk pelanggan yang sudah melakukan pesanan kedua. Jika seseorang telah memesan untuk kedua kalinya, Anda akan melihat jumlah hari antara pesanan pertama dan kedua pada variabel daysSinceFirstPurch. Untuk pelanggan tanpa pesanan kedua, daysSinceFirstPurch berisi waktu sejak pesanan pertama (dan yang terbaru) mereka.
Paket ggplot2 sudah dimuat ke workspace Anda.
Latihan ini adalah bagian dari kursus
Machine Learning untuk Analitik Pemasaran dengan R
Petunjuk latihan
- Lihat data menggunakan
head(). - Buat histogram hari sejak pembelian pertama secara terpisah untuk pelanggan dengan vs. tanpa pesanan kedua. (Jika Anda belum terbiasa dengan kode
ggplot2, jangan khawatir: Anda hanya perlu menggunakandaysSinceFirstPurchsebagai variabel x danboughtAgainsebagai variabel fill dan facet.)
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Look at the head of the data
___(dataNextOrder)
# Plot a histogram
ggplot(dataNextOrder) +
geom_histogram(aes(x = ___,
fill = factor(___))) +
facet_grid( ~ boughtAgain) + # Separate plots for boughtAgain = 1 vs. 0
theme(legend.position = "none") # Don't show legend