Deine KDEs verbessern
Eine Möglichkeit, KDEs zu verbessern, ist das Hinzufügen eines Rug Plots. Rug Plots sind kleine Striche unterhalb der Dichtekurve, die genau zeigen, wo jeder Datenpunkt liegt. Ein Rug Plot ist besonders hilfreich, wenn du nicht viele Daten hast.
Bei kleinen Datenmengen gibt es entlang des Wertebereichs oft Lücken ohne Daten. Dann ist es schwer zu erkennen, ob eine von null verschiedene KDE-Linie bedeutet, dass Daten vorhanden sind, oder ob sie durch einen breiten Kernel entsteht. Ein Rug Plot hilft dabei.
Kehren wir zur Funktion sns.kdeplot() zurück und zeichnen zwei KDEs: eine für die Daten der Vandenberg Air Force Base und eine für alle anderen Städte im Luftverschmutzungsdatensatz. Da deutlich weniger Daten zur Form des Vandenberg-Plots beitragen, füge darunter einen Rug Plot hinzu.
Diese Übung ist Teil des Kurses
So verbesserst du deine Datenvisualisierungen in Python
Anleitung zur Übung
- Färbe den Vandenberg-Plot in
'steelblue'. - Schalte die Rug-Plot-Funktionalität im Vandenberg-Plot ein.
- Setze die Farbe des Nicht-Vandenberg-Plots auf
'gray'.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
sns.kdeplot(pollution[pollution.city == 'Vandenberg Air Force Base'].O3,
label = 'Vandenberg',
# Turn the color blue to stand out
color = '____')
# Turn on rugplot
sns.____(pollution[pollution.city == 'Vandenberg Air Force Base'].O3,
label = 'Vandenberg',
color = 'steelblue')
sns.kdeplot(pollution[pollution.city != 'Vandenberg Air Force Base'].O3,
label = 'Other cities',
# Turn the color gray
color = '____')
plt.show()