1. Обучение
  2. /
  3. Курса
  4. /
  5. Введение в визуализацию данных с помощью Seaborn

Connected

упражнение

Скрытие выбросов

Теперь воспользуемся набором данных student_data, чтобы сравнить распределение итоговых оценок ("G3") у студентов с доступом к интернету дома и без него. Для этого будем использовать переменную "internet" — бинарный индикатор (да/нет), показывающий наличие домашнего интернета.

Поскольку в сельской местности доступ к интернету может быть ограничен, добавим разбивку по месту проживания студента. Для этого используем переменную "location", которая указывает, живёт ли студент в городе ("Urban") или в сельской местности ("Rural").

Seaborn уже импортирован как sns, а matplotlib.pyplot — как plt. Напомним: чтобы скрыть выбросы на ящичковых диаграммах, задайте showfliers=False.

Инструкции

100 XP
  • С помощью sns.catplot() постройте ящичковую диаграмму на основе DataFrame student_data, разместив "internet" по оси x, а "G3" — по оси y.
  • Добавьте подгруппы так, чтобы каждый ящик окрашивался в зависимости от значения "location".
  • Не отображайте выбросы.