Datenerkundung mit KDE-Diagrammen
Diagramme zur Kerndichteschätzung (Kernel Density Estimate, KDE) sind eine gute Alternative zu Histogrammen, wenn du mehrere Verteilungen in einem Bild darstellen möchtest.
Angenommen, du interessierst dich für den Zusammenhang zwischen der Dauer der Ehe und der Anzahl der Kinder, die ein Paar hat. Da die Werte in der Spalte num_kids
nur von 1 bis 5 reichen, kannst du die KDE für jeden Wert im selben Diagramm darstellen.
Der DataFrame divorce
wurde für dich geladen. pandas
wurde als pd
geladen, matplotlib.pyplot
als plt
und Seaborn als sns
. Erinnere dich daran, dass die Spalte num_kids
in divorce
nur N/A
(„nicht zutreffend“) für Paare ohne Kinder auflistet. Du wirst also nur die Verteilungen für geschiedene Paare mit mindestens einem Kind betrachten.
Diese Übung ist Teil des Kurses
Explorative Datenanalyse in Python
Interaktive Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
# Create the KDE plot
____
plt.show()