1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Úvod do vizualizace dat se Seabornem

Connected

cvičení

Skrytí odlehlých hodnot

Teď použijeme dataset student_data k porovnání rozdělení závěrečných známek ("G3") mezi studenty, kteří mají přístup k internetu doma, a těmi, kteří ho nemají. K tomu využijeme proměnnou "internet", což je binární indikátor (ano/ne) přítomnosti domácího připojení k internetu.

Protože internet může být méně dostupný ve venkovských oblastech, přidáme podskupiny podle místa bydliště. Poslouží nám k tomu proměnná "location", která označuje, zda student žije ve městě ("Urban"), nebo na venkově ("Rural").

Seaborn je už naimportován jako sns a matplotlib.pyplot jako plt. Připomínáme, že odlehlé hodnoty v krabicových grafech skryješ nastavením showfliers=False.

Pokyny

100 XP
  • Pomocí sns.catplot() vytvoř krabicový graf z DataFrame student_data, přičemž na osu x umísti proměnnou "internet" a na osu y proměnnou "G3".
  • Přidej podskupiny tak, aby každý krabicový graf byl obarvený podle proměnné "location".
  • Odlehlé hodnoty nezobrazuj.