Mulai sekarangMulai gratis

Keterkaitan antara durasi perjalanan dan total tarif

Kita dapat berasumsi bahwa ada keterkaitan antara total tarif taksi dan durasi perjalanan. Karena ada terlalu banyak titik data untuk membuat scatterplot, mari gunakan plot dengan bin heksagon untuk menelusuri keterkaitan ini.

tx tersedia untuk Anda di ruang kerja Anda.

Latihan ini merupakan bagian dari kursus

Visualizing Big Data with Trelliscope in R

Lihat Kursus

Instruksi latihan

  • Gunakan bin heksagon untuk memvisualisasikan sebaran bivariat total_amount (sumbu y) vs. trip_duration (sumbu x).
  • Setel argumen bins pada geom_hex() menjadi 75.
  • Karena kedua variabel sangat miring (skewed), ubah skala sumbu x dan y ke log basis 10. Perhatikan bahwa transformasi ini akan menghasilkan beberapa peringatan tentang sejumlah kecil rekaman dengan durasi perjalanan atau total tarif bernilai nol.

Latihan interaktif langsung praktik

Cobalah latihan ini dengan melengkapi kode contoh ini.

library(ggplot2)

# Create a hexagon-binned plot of total_amount vs. trip_duration
ggplot(tx, aes(___, ___)) +
  ___ +
  ___ +
  ___
Edit dan Jalankan Kode