Keterkaitan antara durasi perjalanan dan total tarif
Kita dapat berasumsi bahwa ada keterkaitan antara total tarif taksi dan durasi perjalanan. Karena ada terlalu banyak titik data untuk membuat scatterplot, mari gunakan plot dengan bin heksagon untuk menelusuri keterkaitan ini.
tx tersedia untuk Anda di ruang kerja Anda.
Latihan ini merupakan bagian dari kursus
Visualizing Big Data with Trelliscope in R
Instruksi latihan
- Gunakan bin heksagon untuk memvisualisasikan sebaran bivariat
total_amount(sumbu y) vs.trip_duration(sumbu x). - Setel argumen
binspadageom_hex()menjadi 75. - Karena kedua variabel sangat miring (skewed), ubah skala sumbu x dan y ke log basis 10. Perhatikan bahwa transformasi ini akan menghasilkan beberapa peringatan tentang sejumlah kecil rekaman dengan durasi perjalanan atau total tarif bernilai nol.
Latihan interaktif langsung praktik
Cobalah latihan ini dengan melengkapi kode contoh ini.
library(ggplot2)
# Create a hexagon-binned plot of total_amount vs. trip_duration
ggplot(tx, aes(___, ___)) +
___ +
___ +
___