1. Learn
  2. /
  3. 课程
  4. /
  5. ggplot2 数据可视化进阶

Connected

道练习

使用 stat_sum

在 Vocab 数据集里,education 和 vocabulary 都是整数变量。您在第一门课程中已经看到,这正是导致过度绘制的四个原因之一。两变量的每个交点都会只绘制一个点。

一种解决方案(在步骤 1 中展示)是配合透明度进行抖动(jitter)。另一种方法是使用 stat_sum(),它会计算重叠观测的总数,并将其映射到 size 美学属性上。

stat_sum() 允许使用一个特殊变量 ..prop..,用来显示数据集中取值所占的"比例"。

说明 1/4

undefined XP
  • 1
    • 运行代码,看看抖动配合透明度如何解决过度绘制。
    • 使用 stat_sum() 将抖动点替换为求和统计。
  • 2

    使用合适的比例函数修改 size 美学属性。

    • 添加 scale_size() 函数,将 range 设为从 1 到 10。
  • 3

    在 stat_sum() 中,将 size 设为 ..prop..,使圆的大小表示在整个数据集中所占的比例。

  • 4

    将图形更新为按 education 分组,使圆的大小表示该组内所占的比例。