LoslegenKostenlos starten

Scatter-Matrix numerischer Spalten

Du hast die neuen Daten zu Farmer’s Markets untersucht, und sie sind ziemlich breit – mit vielen Spalten an Informationen pro Marktzeile. Anstatt mühsam jede Kombination numerischer Spalten durchzugehen und für Korrelationen einzelne Scatterplots zu erstellen, entscheidest du dich, mit der eingebauten Funktion in pandas eine Scatter-Matrix zu erstellen.

Wenn du die Bildgröße mit dem Argument figsize vergrößerst, bekommt die dichte Visualisierung etwas Luft. Da sich viele Punkte überlappen werden, hilft eine geringere Punktopazität dabei, die Dichte dieser Überlappungen sichtbar zu machen.

Diese Übung ist Teil des Kurses

<Kurs>So verbesserst du deine Datenvisualisierungen in Python</Kurs>
Kurs ansehen

Übungsanweisungen

  • Unterteile die Spalten des markets DataFrames in numeric_columns, damit die Scatter-Matrix nur numerische, nicht-binä re Spalten zeigt.
  • Erhöhe die Bildgröße auf 15 mal 10, um Gedränge zu vermeiden.
  • Reduziere die Punktopazität auf 50 %, um Bereiche mit Überlappungen zu zeigen.

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Select just the numeric columns (exluding individual goods)
numeric_columns = ['lat', 'lon', 'months_open', 'num_items_sold', 'state_pop']

# Make a scatter matrix of numeric columns
pd.plotting.scatter_matrix(markets[____], 
                             # Make figure large to show details
                             figsize = ____, 
                           # Lower point opacity to show overlap
                           alpha = ____)

plt.show()
Code bearbeiten und ausführen