Ausreißer unterdrücken
Nun prüfst du mithilfe des student_data-Datensatzes, ob die Abschlussnoten ("G3") anders verteilt sind, je nachdem, ob die Schulkinder zu Hause einen Internetzugang haben oder nicht. Dazu nutzt du die binäre Variable "internet", die durch Ja/Nein angibt, ob das jeweilige Kind zu Hause aufs Internet zugreifen kann.
Da es in ländlichen Gegenden möglicherweise einen schlechteren Zugang zum Internet gibt, unterteilst du die Schulkinder zudem nach Wohnorten. Hierfür kannst du die Variable "location" verwenden, die angibt, ob das jeweilige Kind in einer Stadt („Urban“) oder auf dem Land („Rural“) lebt.
Seaborn wurde bereits als sns und matplotlib.pyplot als plt importiert. Zur Erinnerung: Ausreißer kannst du in Kastendiagrammen unterdrücken, indem du dem Parameter sym eine leere Zeichenkette ("") zuweist.
Diese Übung ist Teil des Kurses
Einführung in die Datenvisualisierung mit Seaborn
Anleitung zur Übung
- Erstelle mit
sns.catplot()ein Kastendiagramm für denstudent_data-DataFrame mit"internet"auf der x-Achse und"G3"auf der y-Achse. - Füge Untergruppen hinzu, damit die Kästen anhand der Variable
"location"eingefärbt werden. - Unterdrücke die Anzeige von Ausreißern.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Create a box plot with subgroups and omit the outliers
# Show plot
plt.show()