Keterkaitan antara durasi perjalanan dan total tarif
Kita dapat berasumsi bahwa ada keterkaitan antara total tarif taksi dan durasi perjalanan. Karena ada terlalu banyak titik data untuk membuat scatterplot, mari gunakan plot dengan bin heksagon untuk menelusuri keterkaitan ini.
tx tersedia untuk Anda di ruang kerja Anda.
Latihan ini adalah bagian dari kursus
Visualizing Big Data with Trelliscope in R
Petunjuk latihan
- Gunakan bin heksagon untuk memvisualisasikan sebaran bivariat
total_amount(sumbu y) vs.trip_duration(sumbu x). - Setel argumen
binspadageom_hex()menjadi 75. - Karena kedua variabel sangat miring (skewed), ubah skala sumbu x dan y ke log basis 10. Perhatikan bahwa transformasi ini akan menghasilkan beberapa peringatan tentang sejumlah kecil rekaman dengan durasi perjalanan atau total tarif bernilai nol.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
library(ggplot2)
# Create a hexagon-binned plot of total_amount vs. trip_duration
ggplot(tx, aes(___, ___)) +
___ +
___ +
___