Daten in Bins einteilen
Wenn die Daten auf der x-Achse kontinuierliche Werte sind, kann es hilfreich sein, sie in verschiedene Bins (Klassen) einzuteilen, um Veränderungen in den Daten besser zu visualisieren.
In dieser Übung betrachten wir den Zusammenhang zwischen Studiengebühren (Tuition) und der Anzahl der Studierenden im Bachelor-Bereich, in diesen Daten als UG abgekürzt. Wir starten mit einem Streudiagramm und untersuchen anschließend, wie sich unterschiedliche Bin-Größen auf die Visualisierung auswirken.
Diese Übung ist Teil des Kurses
Fortgeschrittene Datenvisualisierung mit Seaborn
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Create a scatter plot by disabling the regression line
sns.regplot(data=df,
y='Tuition',
x='UG',
fit_reg=____)
plt.show()
plt.clf()