Uitschieters weglaten
Laten we nu de gegevensset student_data gebruiken om de verdeling van eindcijfers ("G3") te vergelijken tussen studenten die thuis internettoegang hebben en studenten die dat niet hebben. Hiervoor gebruiken we de variabele "internet", een binaire (ja/nee) indicator of de student thuis internet heeft.
Omdat internet op het platteland mogelijk minder toegankelijk is, voegen we subgroepen toe op basis van waar de student woont. Hiervoor kunnen we de variabele "location" gebruiken, een indicator of een student in een stedelijk ("Urban") of landelijk ("Rural") gebied woont.
Seaborn is al geïmporteerd als sns en matplotlib.pyplot is geïmporteerd als plt. Ter herinnering: je kunt uitschieters in boxplots weglaten door showfliers=False in te stellen.
Deze oefening maakt deel uit van de cursus
Introductie tot datavisualisatie met Seaborn
Oefeninstructies
- Gebruik
sns.catplot()om een boxplot te maken met de DataFramestudent_data, met"internet"op de x-as en"G3"op de y-as. - Voeg subgroepen toe zodat elke boxplot is ingekleurd op basis van
"location". - Geef de uitschieters niet weer.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Create a box plot with subgroups and omit the outliers
# Show plot
plt.show()