Ausreißer auslassen
Nun wollen wir den Datensatz student_data
verwenden, um die Verteilung der Abschlussnoten ("G3"
) zwischen Schülern, die zu Hause einen Internetzugang haben, und denen, die keinen haben, zu vergleichen. Dazu verwenden wir die Variable "internet"
, die als binärer Indikator (ja/nein) angibt, ob der/die Schüler/in zu Hause einen Internetzugang hat.
Da der Internetzugang in ländlichen Gegenden möglicherweise weniger gut ist, werden wir Untergruppen je nach Wohnort der Schüler/innen bilden. Hierfür können wir die Variable "location"
verwenden, die angibt, ob ein Schüler in einer Stadt ("Urban") oder auf dem Land ("Rural") lebt.
Seaborn wurde bereits als sns
importiert und matplotlib.pyplot
wurde als plt
importiert. Zur Erinnerung: Du kannst Ausreißer in Boxplots auslassen, indem du den Parameter sym
auf eine leere Zeichenkette setzt (""
).
Diese Übung ist Teil des Kurses
Einführung in die Datenvisualisierung mit Seaborn
Anleitung zur Übung
- Verwende
sns.catplot()
, um ein Boxplot mit demstudent_data
DataFrame zu erstellen, indem du"internet"
auf die x-Achse und"G3"
auf die y-Achse setzt. - Füge Untergruppen hinzu, damit jedes Boxplot auf der Grundlage von
"location"
gefärbt wird. - Lass die Ausreißer nicht anzeigen.
Interaktive Übung zum Anfassen
Probieren Sie diese Übung aus, indem Sie diesen Beispielcode ausführen.
# Create a box plot with subgroups and omit the outliers
# Show plot
plt.show()