MulaiMulai sekarang secara gratis

Data untuk survival analysis

Pada latihan berikut, Anda akan bekerja dengan data pelanggan sebuah toko online untuk berlatih survival analysis. Namun kali ini bukan tentang waktu hingga churn, melainkan waktu hingga pesanan kedua.

Data disimpan dalam objek dataNextOrder. Variabel boughtAgain bernilai 0 untuk pelanggan dengan hanya satu pesanan dan 1 untuk pelanggan yang sudah melakukan pesanan kedua. Jika seseorang telah memesan untuk kedua kalinya, Anda akan melihat jumlah hari antara pesanan pertama dan kedua pada variabel daysSinceFirstPurch. Untuk pelanggan tanpa pesanan kedua, daysSinceFirstPurch berisi waktu sejak pesanan pertama (dan yang terbaru) mereka.

Paket ggplot2 sudah dimuat ke workspace Anda.

Latihan ini adalah bagian dari kursus

Machine Learning untuk Analitik Pemasaran dengan R

Lihat Kursus

Petunjuk latihan

  • Lihat data menggunakan head().
  • Buat histogram hari sejak pembelian pertama secara terpisah untuk pelanggan dengan vs. tanpa pesanan kedua. (Jika Anda belum terbiasa dengan kode ggplot2, jangan khawatir: Anda hanya perlu menggunakan daysSinceFirstPurch sebagai variabel x dan boughtAgain sebagai variabel fill dan facet.)

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Look at the head of the data
___(dataNextOrder)

# Plot a histogram
ggplot(dataNextOrder) +
  geom_histogram(aes(x = ___,
                     fill = factor(___))) +
  facet_grid( ~ boughtAgain) + # Separate plots for boughtAgain = 1 vs. 0
  theme(legend.position = "none") # Don't show legend
Edit dan Jalankan Kode