1. Learn
  2. /
  3. Courses
  4. /
  5. ggplot2 中級データ可視化

Connected

Exercise

stat_sum の使用

Vocab データセットでは、education と vocabulary は整数の変数です。入門コースで学んだように、これはオーバープロットの4つの原因の1つでした。2つの変数の交点ごとに点が1つだけ重なってしまいます。

ステップ1で示す1つの解決策は、透過性をつけたジッターです。もう1つの解決策は stat_sum() を使う方法で、重なっている観測値の合計数を計算し、それを size 美的属性に対応づけます。

stat_sum() では特別な変数 ..prop.. を使って、データセット内での値の「割合」を表示できます。

Instructions 1/4

undefined XP
  • 1
    • コードを実行して、ジッターと透過性でオーバープロットがどのように解決されるかを確認します。
    • ジッターの点を、stat_sum() を使った合計の統計に置き換えます。
  • 2

    適切なスケール関数で size の美的属性を調整します。

    • scale_size() を追加し、range を 1 から 10 に設定します。
  • 3

    stat_sum() の中で、size を ..prop.. に設定し、円の大きさがデータ全体に対する割合を表すようにします。

  • 4

    プロットを education ごとにグループ化するよう更新し、円の大きさが各グループ内での割合を表すようにします。