Distribusi jumlah tip difaset menurut jenis pembayaran
Distribusi total ongkos taksi yang kita buat sebelumnya cukup menarik, tetapi kita mungkin bisa memperoleh wawasan tambahan dengan menelusuri apakah distribusi tersebut bervariasi terhadap variabel lain. Dalam latihan ini, kita akan melihat bagian jumlah tip dari distribusi ongkos taksi dan memeriksa apakah berbeda untuk berbagai jenis pembayaran dengan membuat histogram dan melakukan faceting berdasarkan jenis pembayaran.
tx telah dimuat sebelumnya ke dalam workspace Anda.
Latihan ini adalah bagian dari kursus
Visualizing Big Data with Trelliscope in R
Petunjuk latihan
- Buat histogram dari
tip_amount + 0.01(tambahkan satu sen ke setiap tip karena kita akan melakukan transformasi log dan ada tip yang bernilai nol). - Gunakan
scale_x_log10()untuk mentransformasi sumbu x. - Gunakan
facet_wrap()untuk memfacet berdasarkanpayment_type. Untuk membantu membandingkan distribusi secara visual, atur jumlah kolom menjadi1dan buat skala sumbu y bebas dengan menentukan skala sebagai"free_y".
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
library(ggplot2)
# Histogram of the tip amount faceted on payment type
ggplot(___, aes(___)) +
___ +
___ +
facet_wrap(~ ___, ncol = ___, scales = ___)