1. Learn
  2. /
  3. 课程
  4. /
  5. 使用 ggplot2 进行数据可视化入门

Connected

道练习

过度叠加 1:大型数据集

散点图(使用 geom_point())直观、易懂且非常常见,但我们必须始终考虑过度叠加,尤其在以下 4 种情形:

  1. 大型数据集
  2. 在单一坐标轴上取值对齐
  3. 低精度数据
  4. 整数数据

通常,在使用实心点形时,建议进行 alpha 混合(即添加透明度)。或者,您也可以使用不透明的空心点形。

当数据集中存在高密度区域(大量重叠)时,小点更合适。

让我们用 diamonds 数据集来练习应对大型数据集的情况。

说明 1/2

undefined XP
  • 1

    在基础图上添加一个点图层。

    • 将点的透明度设为 0.5。
    • 将 shape = ".",即点大小为 1 像素。
  • 2

    更新点的形状,通过将 shape 设为 16 来去除边线。