Scatter matrix delle colonne numeriche
Hai esplorato i nuovi dati dei farmer's market ed è un insieme piuttosto ampio, con molte colonne di informazioni per ciascuna riga di mercato. Invece di analizzare a mano ogni combinazione di colonne numeriche e creare uno scatter plot per cercare correlazioni, decidi di creare una scatter matrix usando la funzione integrata di pandas.
Aumentare la dimensione della figura con l'argomento figsize aiuterà a dare un po' di respiro a una visualizzazione densa. Dato che ci sarà molta sovrapposizione tra i punti, ridurre l'opacità dei punti aiuterà a mostrare la densità di queste sovrapposizioni.
Questo esercizio fa parte del corso
Migliorare le tue visualizzazioni dei dati in Python
Istruzioni dell'esercizio
- Sottoseleziona le colonne del DataFrame
marketsinnumeric_columnscosì che la scatter matrix mostri solo le colonne numeriche non binarie. - Aumenta la dimensione della figura a
15per10per evitare affollamenti. - Riduci l'opacità dei punti al 50% per evidenziare le aree di sovrapposizione.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Select just the numeric columns (exluding individual goods)
numeric_columns = ['lat', 'lon', 'months_open', 'num_items_sold', 'state_pop']
# Make a scatter matrix of numeric columns
pd.plotting.scatter_matrix(markets[____],
# Make figure large to show details
figsize = ____,
# Lower point opacity to show overlap
alpha = ____)
plt.show()