1. 学ぶ
  2. /
  3. コース
  4. /
  5. Seabornで学ぶデータ可視化入門

Connected

演習

外れ値を省く

それでは、student_data データセットを使って、自宅にインターネット環境がある学生とない学生で、最終成績("G3")の分布を比較してみましょう。そのために、自宅でインターネットにアクセスできるかどうかを示す二値(yes/no)の指標である "internet" 変数を使います。

インターネットは地方のほうが利用しづらい可能性があるため、居住地に基づくサブグループを追加します。ここでは、学生が都市("Urban")か地方("Rural")に住んでいるかを示す "location" 変数を使います。

Seaborn はすでに sns として、matplotlib.pyplot は plt としてインポート済みです。なお、箱ひげ図で外れ値を表示しないようにするには、showfliers=False を設定します。

指示

100 XP
  • sns.catplot() を使って、student_data DataFrame から箱ひげ図を作成し、x 軸に "internet"、y 軸に "G3" を指定します。
  • それぞれの箱ひげ図が "location" に基づいて色分けされるようにサブグループを追加します。
  • 外れ値は表示しないでください。