MulaiMulai sekarang secara gratis

Keterkaitan antara durasi perjalanan dan total tarif

Kita dapat berasumsi bahwa ada keterkaitan antara total tarif taksi dan durasi perjalanan. Karena ada terlalu banyak titik data untuk membuat scatterplot, mari gunakan plot dengan bin heksagon untuk menelusuri keterkaitan ini.

tx tersedia untuk Anda di ruang kerja Anda.

Latihan ini adalah bagian dari kursus

Visualizing Big Data with Trelliscope in R

Lihat Kursus

Petunjuk latihan

  • Gunakan bin heksagon untuk memvisualisasikan sebaran bivariat total_amount (sumbu y) vs. trip_duration (sumbu x).
  • Setel argumen bins pada geom_hex() menjadi 75.
  • Karena kedua variabel sangat miring (skewed), ubah skala sumbu x dan y ke log basis 10. Perhatikan bahwa transformasi ini akan menghasilkan beberapa peringatan tentang sejumlah kecil rekaman dengan durasi perjalanan atau total tarif bernilai nol.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

library(ggplot2)

# Create a hexagon-binned plot of total_amount vs. trip_duration
ggplot(tx, aes(___, ___)) +
  ___ +
  ___ +
  ___
Edit dan Jalankan Kode