Esplora l'insieme di dati degli acquisti per prodotto dei clienti
Hai esplorato l'insieme di dati sugli acquisti per prodotto dei clienti nell'esercizio video e ora sei pronto a tracciare alcuni grafici esplorativi per capire la distribuzione delle variabili e le relazioni tra di esse. Qui esplorerai il dataset wholesale e traccerai sia le relazioni a coppie sia le distribuzioni stimate per ogni variabile con la funzione pairplot della libreria seaborn. È un passaggio importante per comprendere i tipi di distribuzione e le relazioni tra variabili, così da capire se è necessario un ulteriore preprocessing dei dati.
La libreria pandas è già caricata come pd, seaborn come sns e matplotlib.pyplot come plt. Inoltre, il dataset wholesale è stato caricato come DataFrame di pandas.
Questo esercizio fa parte del corso
Machine Learning per il marketing con Python
Istruzioni dell'esercizio
- Stampa l'header del dataset
wholesale - Traccia le relazioni a coppie tra le variabili
- Mostra il grafico.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Print the header of the `wholesale` dataset
print(___.head())
# Plot the pairwise relationships between the variables
sns.pairplot(___, diag_kind='kde')
# Display the chart
plt.___()