1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Trực quan hóa Dữ liệu Lớn với Trelliscope trong R

Connected

Bài tập

Mối quan hệ giữa thời lượng chuyến đi và tổng tiền cước

Ta có thể giả định rằng có mối liên hệ giữa tổng tiền taxi và thời lượng chuyến đi. Vì có quá nhiều điểm dữ liệu để vẽ biểu đồ phân tán, hãy dùng biểu đồ theo ô lục giác (hexbin) để khảo sát mối quan hệ này.

tx đã có sẵn trong không gian làm việc của bạn.

Hướng dẫn

100 XP
  • Dùng các ô lục giác để trực quan hóa phân phối hai biến của total_amount (trục y) so với trip_duration (trục x).
  • Đặt đối số bins của geom_hex() là 75.
  • Vì cả hai biến đều lệch mạnh, hãy chuyển đổi cả trục x và trục y sang thang log cơ số 10. Lưu ý rằng các phép biến đổi này sẽ tạo ra một số cảnh báo về một lượng nhỏ bản ghi có thời lượng chuyến đi hoặc số tiền cước bằng 0.