Aan de slagGa gratis aan de slag

Uitschieters weglaten

Laten we nu de gegevensset student_data gebruiken om de verdeling van eindcijfers ("G3") te vergelijken tussen studenten die thuis internettoegang hebben en studenten die dat niet hebben. Hiervoor gebruiken we de variabele "internet", een binaire (ja/nee) indicator of de student thuis internet heeft.

Omdat internet op het platteland mogelijk minder toegankelijk is, voegen we subgroepen toe op basis van waar de student woont. Hiervoor kunnen we de variabele "location" gebruiken, een indicator of een student in een stedelijk ("Urban") of landelijk ("Rural") gebied woont.

Seaborn is al geïmporteerd als sns en matplotlib.pyplot is geïmporteerd als plt. Ter herinnering: je kunt uitschieters in boxplots weglaten door showfliers=False in te stellen.

Deze oefening maakt deel uit van de cursus

Introductie tot datavisualisatie met Seaborn

Cursus bekijken

Oefeninstructies

  • Gebruik sns.catplot() om een boxplot te maken met de DataFrame student_data, met "internet" op de x-as en "G3" op de y-as.
  • Voeg subgroepen toe zodat elke boxplot is ingekleurd op basis van "location".
  • Geef de uitschieters niet weer.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Create a box plot with subgroups and omit the outliers






# Show plot
plt.show()
Code bewerken en uitvoeren