Scattermatrix van numerieke kolommen
Je hebt de nieuwe gegevens over boerenmarkten bekeken, en die zijn vrij breed: veel kolommen met info per markt. In plaats van elke combinatie van numerieke kolommen handmatig te doorlopen en een scatterplot te maken om naar correlaties te kijken, maak je een scattermatrix met de ingebouwde functie van pandas.
Door het figuur te vergroten met het argument figsize krijgt de dichte visualisatie wat meer lucht. Omdat er veel overlap tussen punten zal zijn, helpt het om de puntdekking te verlagen zodat de dichtheid van deze overlappingen zichtbaar wordt.
Deze oefening maakt deel uit van de cursus
Je datavisualisaties verbeteren in Python
Oefeninstructies
- Selecteer de kolommen van de DataFrame
marketstotnumeric_columns, zodat de scattermatrix alleen numerieke niet-binaire kolommen toont. - Vergroot de figuurgrootte naar
15bij10om te voorkomen dat het te vol wordt. - Verlaag de puntdekking naar 50% om overlappende gebieden zichtbaar te maken.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Select just the numeric columns (exluding individual goods)
numeric_columns = ['lat', 'lon', 'months_open', 'num_items_sold', 'state_pop']
# Make a scatter matrix of numeric columns
pd.plotting.scatter_matrix(markets[____],
# Make figure large to show details
figsize = ____,
# Lower point opacity to show overlap
alpha = ____)
plt.show()