Erste SchritteKostenlos loslegen

Ausreißer auslassen

Nun wollen wir den Datensatz student_data verwenden, um die Verteilung der Abschlussnoten ("G3") zwischen Schülern, die zu Hause einen Internetzugang haben, und denen, die keinen haben, zu vergleichen. Dazu verwenden wir die Variable "internet", die als binärer Indikator (ja/nein) angibt, ob der/die Schüler/in zu Hause einen Internetzugang hat.

Da der Internetzugang in ländlichen Gegenden möglicherweise weniger gut ist, werden wir Untergruppen je nach Wohnort der Schüler/innen bilden. Hierfür können wir die Variable "location" verwenden, die angibt, ob ein Schüler in einer Stadt ("Urban") oder auf dem Land ("Rural") lebt.

Seaborn wurde bereits als sns importiert und matplotlib.pyplot wurde als plt importiert. Zur Erinnerung: Du kannst Ausreißer in Boxplots auslassen, indem du den Parameter sym auf eine leere Zeichenkette setzt ("").

Diese Übung ist Teil des Kurses

Einführung in die Datenvisualisierung mit Seaborn

Kurs anzeigen

Anleitung zur Übung

  • Verwende sns.catplot(), um ein Boxplot mit dem student_data DataFrame zu erstellen, indem du "internet" auf die x-Achse und "G3" auf die y-Achse setzt.
  • Füge Untergruppen hinzu, damit jedes Boxplot auf der Grundlage von "location" gefärbt wird.
  • Lass die Ausreißer nicht anzeigen.

Interaktive Übung zum Anfassen

Probieren Sie diese Übung aus, indem Sie diesen Beispielcode ausführen.

# Create a box plot with subgroups and omit the outliers






# Show plot
plt.show()
Bearbeiten und Ausführen von Code