IniziaInizia gratis

Scatter matrix delle colonne numeriche

Hai esplorato i nuovi dati dei farmer's market ed è un insieme piuttosto ampio, con molte colonne di informazioni per ciascuna riga di mercato. Invece di analizzare a mano ogni combinazione di colonne numeriche e creare uno scatter plot per cercare correlazioni, decidi di creare una scatter matrix usando la funzione integrata di pandas.

Aumentare la dimensione della figura con l'argomento figsize aiuterà a dare un po' di respiro a una visualizzazione densa. Dato che ci sarà molta sovrapposizione tra i punti, ridurre l'opacità dei punti aiuterà a mostrare la densità di queste sovrapposizioni.

Questo esercizio fa parte del corso

Migliorare le tue visualizzazioni dei dati in Python

Visualizza il corso

Istruzioni dell'esercizio

  • Sottoseleziona le colonne del DataFrame markets in numeric_columns così che la scatter matrix mostri solo le colonne numeriche non binarie.
  • Aumenta la dimensione della figura a 15 per 10 per evitare affollamenti.
  • Riduci l'opacità dei punti al 50% per evidenziare le aree di sovrapposizione.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Select just the numeric columns (exluding individual goods)
numeric_columns = ['lat', 'lon', 'months_open', 'num_items_sold', 'state_pop']

# Make a scatter matrix of numeric columns
pd.plotting.scatter_matrix(markets[____], 
                             # Make figure large to show details
                             figsize = ____, 
                           # Lower point opacity to show overlap
                           alpha = ____)

plt.show()
Modifica ed esegui il codice