1. Uczyć się
  2. /
  3. Courses
  4. /
  5. ggplot2 で始めるデータ可視化入門

Connected

Exercise

オーバープロット対策 1:大規模データ

散布図(geom_point())は直感的で分かりやすく、とても一般的ですが、次の4つの状況では特に、オーバープロットを常に意識する必要があります。

  1. 大規模データ
  2. 片方の軸上で値がそろっている場合
  3. 低精度のデータ
  4. 整数データ

通常、塗りつぶしのマーカーを使う場合は、アルファブレンディング(透明度を加える)が推奨されます。別案として、不透明で中抜きの形状を使う方法もあります。

密度の高い領域(重なりが多い)を含む大規模データには、小さな点が適しています。

ここでは diamonds データセットを使って、大規模データの場合の対処法を練習します。

Instrukcje 1 / 2

undefined XP
  • 1

    ベースプロットにポイント層を追加してください。

    • 点の透明度を 0.5 に設定します。
    • shape = "."(1ピクセルの点)を設定します。
  • 2

    点の外枠線をなくすために、shape を 16 に設定して形状を更新してください。