1. 学ぶ
  2. /
  3. コース
  4. /
  5. RのTrelliscopeでビッグデータを可視化する

Connected

演習

支払い方法別の運賃分布の比較

現金払いではチップが記録されていないことがわかりました。これは、現金払いの人がチップを渡さないからなのか、それとも現金払いの場合にチップが記録されないからなのでしょうか?同じような経路であれば、支払い方法に関わらず合計運賃の分布は同じになるはずです。この演習では、支払い方法別の合計運賃の分布を分位数プロットで比較し、元のプロットと並べて別のファセットで確認します。

payment_type、amount、amount_type の変数を含む amount_compare データセットがあらかじめ用意されています。amount_type は、合計支払い額とチップなし支払い額を区別するための変数です。

指示

100 XP
  • 演習を始める前に、amount_compare データセットをコンソールに出力して構造を確認しましょう。プロットの仕様を理解するのに役立ちます。
  • geom_qq() を使って合計運賃 amount の分位数プロットを作成します。distribution = stats::qunif を必ず指定してください。
  • 支払い方法ごとに別々の分位数プロットが同じプロット上に重なって表示されるよう、支払い方法で color を設定しましょう。
  • amount_type ごとに分布を比較できるよう、ファセット分割を適用してください。