Ausreißer unterdrücken
Nun prüfst du mithilfe des student_data
-Datensatzes, ob die Abschlussnoten ("G3"
) anders verteilt sind, je nachdem, ob die Schulkinder zu Hause einen Internetzugang haben oder nicht. Dazu nutzt du die binäre Variable "internet"
, die durch Ja/Nein angibt, ob das jeweilige Kind zu Hause aufs Internet zugreifen kann.
Da es in ländlichen Gegenden möglicherweise einen schlechteren Zugang zum Internet gibt, unterteilst du die Schulkinder zudem nach Wohnorten. Hierfür kannst du die Variable "location"
verwenden, die angibt, ob das jeweilige Kind in einer Stadt („Urban“) oder auf dem Land („Rural“) lebt.
Seaborn wurde bereits als sns
und matplotlib.pyplot
als plt
importiert. Zur Erinnerung: Ausreißer kannst du in Kastendiagrammen unterdrücken, indem du dem Parameter sym
eine leere Zeichenkette (""
) zuweist.
Diese Übung ist Teil des Kurses
Einführung in die Datenvisualisierung mit Seaborn
Anleitung zur Übung
- Erstelle mit
sns.catplot()
ein Kastendiagramm für denstudent_data
-DataFrame mit"internet"
auf der x-Achse und"G3"
auf der y-Achse. - Füge Untergruppen hinzu, damit die Kästen anhand der Variable
"location"
eingefärbt werden. - Unterdrücke die Anzeige von Ausreißern.
Interaktive Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
# Create a box plot with subgroups and omit the outliers
# Show plot
plt.show()