Mit grundlegenden Transformationen tiefer einsteigen
Du möchtest wissen, ob die Bevölkerung eines Bundesstaates mit der Anzahl der auf Wochenmärkten verkauften Artikel korreliert. Um das zu prüfen, nimm den Logarithmus der Bevölkerung und zeichne ein Streudiagramm gegen die Anzahl der von einem Markt verkauften Artikel. Aus deinen früheren Erkundungen des Datensatzes weißt du, dass es viel Überlappung geben wird. Um die Muster besser zu erkennen, möchtest du die Markertransparenz reduzieren.
Diese Übung ist Teil des Kurses
So verbesserst du deine Datenvisualisierungen in Python
Anleitung zur Übung
- Verwende
numpy(importiert alsnp), um eine neue Spaltelog_popzu erstellen, indem du den Logarithmus der Bevölkerung der Bundesstaaten berechnest. - Übergebe diese neu erstellte logarithmierte Spalte an das x-Mapping der Streudiagramm-Funktion.
- Setze die Transparenz des Streudiagramms auf 25 %, um Überlappungen sichtbar zu machen.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Create a new logged population column
markets['____'] = np.____(markets['____'])
# Draw a scatterplot of log-population to # of items sold
sns.scatterplot(x = '____',
y = 'num_items_sold',
# Reduce point opacity to show overlap
____ = ____,
data = markets)
plt.show()