Scatter-Matrix numerischer Spalten
Du hast die neuen Daten zu Farmer’s Markets untersucht, und sie sind ziemlich breit – mit vielen Spalten an Informationen pro Marktzeile. Anstatt mühsam jede Kombination numerischer Spalten durchzugehen und für Korrelationen einzelne Scatterplots zu erstellen, entscheidest du dich, mit der eingebauten Funktion in pandas eine Scatter-Matrix zu erstellen.
Wenn du die Bildgröße mit dem Argument figsize vergrößerst, bekommt die dichte Visualisierung etwas Luft. Da sich viele Punkte überlappen werden, hilft eine geringere Punktopazität dabei, die Dichte dieser Überlappungen sichtbar zu machen.
Diese Übung ist Teil des Kurses
<Kurs>So verbesserst du deine Datenvisualisierungen in Python</Kurs>Übungsanweisungen
- Unterteile die Spalten des
marketsDataFrames innumeric_columns, damit die Scatter-Matrix nur numerische, nicht-binä re Spalten zeigt. - Erhöhe die Bildgröße auf
15mal10, um Gedränge zu vermeiden. - Reduziere die Punktopazität auf 50 %, um Bereiche mit Überlappungen zu zeigen.
Interaktive praktische Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
# Select just the numeric columns (exluding individual goods)
numeric_columns = ['lat', 'lon', 'months_open', 'num_items_sold', 'state_pop']
# Make a scatter matrix of numeric columns
pd.plotting.scatter_matrix(markets[____],
# Make figure large to show details
figsize = ____,
# Lower point opacity to show overlap
alpha = ____)
plt.show()