Mengeksplorasi variabel penjelas
Ketika variabel respons bertipe logika, semua titik berada pada garis y sama dengan nol dan y sama dengan satu, sehingga sulit melihat apa yang terjadi. Dalam video, hingga Anda melihat garis tren, distribusi variabel penjelas pada masing-masing garis tidak terlihat jelas. Ini dapat diatasi dengan histogram variabel penjelas yang difaset berdasarkan respons.
Anda akan menggunakan histogram ini untuk mengenali himpunan data churn layanan keuangan seperti yang terlihat dalam video.
churn tersedia dan ggplot2 sudah dimuat.
Latihan ini adalah bagian dari kursus
Pengantar Regresi di R
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Using churn, plot time_since_last_purchase
___ +
# as a histogram with binwidth 0.25
___ +
# faceted in a grid with has_churned on each row
___