1. Learn
  2. /
  3. 课程
  4. /
  5. Seaborn 数据可视化入门

Connected

道练习

省略离群值

现在请使用 student_data 数据集,比较在家有网络与没有网络的学生其期末成绩("G3")的分布。为此,我们将使用 "internet" 变量。它是一个二元(是/否)指标,表示学生在家中是否有网络。

由于农村地区的网络可能不太普及,我们将按学生的居住地再细分子组。可以使用 "location" 变量,它指示学生居住在城市("Urban")还是农村("Rural")。

Seaborn 已导入为 sns,matplotlib.pyplot 已导入为 plt。提醒:在箱线图中可以通过设置 showfliers=False 来省略离群值。

说明

100 XP
  • 使用 sns.catplot() 基于 student_data DataFrame 创建箱线图,x 轴为 "internet",y 轴为 "G3"。
  • 添加子分组,使每个箱线图根据 "location" 着色。
  • 不要显示离群值。