Kastendiagramme erstellen und interpretieren
Diese Übung nutzt wieder den student_data
-Datensatz. In der vorigen Übung hast du den Zusammenhang zwischen der Lernzeit und der erzielten Abschlussnote untersucht, indem du die durchschnittlichen Abschlussnoten ("G3"
) der Schulkinder für verschiedene Lernzeiten ("study_time"
) mit einem Balkendiagramm verglichen hast.
Jetzt betrachtest du diese Beziehung mit einem Kastendiagramm. Zur Erinnerung: Um ein Kastendiagramm zu erstellen, verwendest du die Funktion catplot()
und übergibst den Namen der kategorialen Variable für die x-Achse (x=____
), den Namen der zusammenzufassenden quantitativen Variable für die y-Achse (y=____
), den zu verwendenden pandas-DataFrame (data=____
) und die gewünschte Diagrammart (kind="box"
).
matplotlib.pyplot
wurde bereits als plt
und seaborn
als sns
importiert.
Diese Übung ist Teil des Kurses
Einführung in die Datenvisualisierung mit Seaborn
Interaktive Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
# Specify the category ordering
study_time_order = ["<2 hours", "2 to 5 hours",
"5 to 10 hours", ">10 hours"]
# Create a box plot and set the order of the categories
# Show plot
plt.show()