1. 学ぶ
  2. /
  3. コース
  4. /
  5. RのTrelliscopeでビッグデータを可視化する

Connected

演習

乗車時間と合計料金の関係

タクシーの合計料金と乗車時間の間には関係があると考えられます。データポイントが多すぎて散布図では確認しにくいため、六角形ビンプロットを使ってこの関係を調べましょう。

ワークスペースには tx が用意されています。

指示

100 XP
  • 六角形ビンを使って、total_amount(y 軸)と trip_duration(x 軸)の二変量分布を可視化しましょう。
  • geom_hex() の bins 引数を 75 に設定します。
  • 両変数は大きく歪んでいるため、x 軸と y 軸の両方を対数(底 10)でスケーリングします。なお、この変換により、乗車時間や料金が 0 のレコードについて警告が一部表示されることがあります。