Aan de slagGa gratis aan de slag

Scattermatrix van numerieke kolommen

Je hebt de nieuwe gegevens over boerenmarkten bekeken, en die zijn vrij breed: veel kolommen met info per markt. In plaats van elke combinatie van numerieke kolommen handmatig te doorlopen en een scatterplot te maken om naar correlaties te kijken, maak je een scattermatrix met de ingebouwde functie van pandas.

Door het figuur te vergroten met het argument figsize krijgt de dichte visualisatie wat meer lucht. Omdat er veel overlap tussen punten zal zijn, helpt het om de puntdekking te verlagen zodat de dichtheid van deze overlappingen zichtbaar wordt.

Deze oefening maakt deel uit van de cursus

Je datavisualisaties verbeteren in Python

Cursus bekijken

Oefeninstructies

  • Selecteer de kolommen van de DataFrame markets tot numeric_columns, zodat de scattermatrix alleen numerieke niet-binaire kolommen toont.
  • Vergroot de figuurgrootte naar 15 bij 10 om te voorkomen dat het te vol wordt.
  • Verlaag de puntdekking naar 50% om overlappende gebieden zichtbaar te maken.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Select just the numeric columns (exluding individual goods)
numeric_columns = ['lat', 'lon', 'months_open', 'num_items_sold', 'state_pop']

# Make a scatter matrix of numeric columns
pd.plotting.scatter_matrix(markets[____], 
                             # Make figure large to show details
                             figsize = ____, 
                           # Lower point opacity to show overlap
                           alpha = ____)

plt.show()
Code bewerken en uitvoeren