Scatter-Matrix numerischer Spalten
Du hast die neuen Daten zu Farmer’s Markets untersucht, und sie sind ziemlich breit – mit vielen Spalten an Informationen pro Marktzeile. Anstatt mühsam jede Kombination numerischer Spalten durchzugehen und für Korrelationen einzelne Scatterplots zu erstellen, entscheidest du dich, mit der eingebauten Funktion in pandas eine Scatter-Matrix zu erstellen.
Wenn du die Bildgröße mit dem Argument figsize vergrößerst, bekommt die dichte Visualisierung etwas Luft. Da sich viele Punkte überlappen werden, hilft eine geringere Punktopazität dabei, die Dichte dieser Überlappungen sichtbar zu machen.
Diese Übung ist Teil des Kurses
So verbesserst du deine Datenvisualisierungen in Python
Anleitung zur Übung
- Unterteile die Spalten des
marketsDataFrames innumeric_columns, damit die Scatter-Matrix nur numerische, nicht-binä re Spalten zeigt. - Erhöhe die Bildgröße auf
15mal10, um Gedränge zu vermeiden. - Reduziere die Punktopazität auf 50 %, um Bereiche mit Überlappungen zu zeigen.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Select just the numeric columns (exluding individual goods)
numeric_columns = ['lat', 'lon', 'months_open', 'num_items_sold', 'state_pop']
# Make a scatter matrix of numeric columns
pd.plotting.scatter_matrix(markets[____],
# Make figure large to show details
figsize = ____,
# Lower point opacity to show overlap
alpha = ____)
plt.show()