Mit grundlegenden Transformationen tiefer einsteigen
Du möchtest wissen, ob die Bevölkerung eines Bundesstaates mit der Anzahl der auf Wochenmärkten verkauften Artikel korreliert. Um das zu prüfen, nimm den Logarithmus der Bevölkerung und zeichne ein Streudiagramm gegen die Anzahl der von einem Markt verkauften Artikel. Aus deinen früheren Erkundungen des Datensatzes weißt du, dass es viel Überlappung geben wird. Um die Muster besser zu erkennen, möchtest du die Markertransparenz reduzieren.
Diese Übung ist Teil des Kurses
<Kurs>So verbesserst du deine Datenvisualisierungen in Python</Kurs>Übungsanweisungen
- Verwende
numpy(importiert alsnp), um eine neue Spaltelog_popzu erstellen, indem du den Logarithmus der Bevölkerung der Bundesstaaten berechnest. - Übergebe diese neu erstellte logarithmierte Spalte an das x-Mapping der Streudiagramm-Funktion.
- Setze die Transparenz des Streudiagramms auf 25 %, um Überlappungen sichtbar zu machen.
Interaktive praktische Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
# Create a new logged population column
markets['____'] = np.____(markets['____'])
# Draw a scatterplot of log-population to # of items sold
sns.scatterplot(x = '____',
y = 'num_items_sold',
# Reduce point opacity to show overlap
____ = ____,
data = markets)
plt.show()