LoslegenKostenlos loslegen

Scatter-Matrix numerischer Spalten

Du hast die neuen Daten zu Farmer’s Markets untersucht, und sie sind ziemlich breit – mit vielen Spalten an Informationen pro Marktzeile. Anstatt mühsam jede Kombination numerischer Spalten durchzugehen und für Korrelationen einzelne Scatterplots zu erstellen, entscheidest du dich, mit der eingebauten Funktion in pandas eine Scatter-Matrix zu erstellen.

Wenn du die Bildgröße mit dem Argument figsize vergrößerst, bekommt die dichte Visualisierung etwas Luft. Da sich viele Punkte überlappen werden, hilft eine geringere Punktopazität dabei, die Dichte dieser Überlappungen sichtbar zu machen.

Diese Übung ist Teil des Kurses

So verbesserst du deine Datenvisualisierungen in Python

Kurs anzeigen

Anleitung zur Übung

  • Unterteile die Spalten des markets DataFrames in numeric_columns, damit die Scatter-Matrix nur numerische, nicht-binä re Spalten zeigt.
  • Erhöhe die Bildgröße auf 15 mal 10, um Gedränge zu vermeiden.
  • Reduziere die Punktopazität auf 50 %, um Bereiche mit Überlappungen zu zeigen.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Select just the numeric columns (exluding individual goods)
numeric_columns = ['lat', 'lon', 'months_open', 'num_items_sold', 'state_pop']

# Make a scatter matrix of numeric columns
pd.plotting.scatter_matrix(markets[____], 
                             # Make figure large to show details
                             figsize = ____, 
                           # Lower point opacity to show overlap
                           alpha = ____)

plt.show()
Code bearbeiten und ausführen