Comprendere le differenze tra le variabili
Ora analizzerai le medie e le deviazioni standard di ogni variabile tracciandole in un barplot. È un passaggio complementare al precedente, perché esplorerai visivamente le differenze nelle scale e nelle varianze delle variabili.
La libreria pandas è caricata come pd e matplotlib.pyplot come plt. Inoltre, il dataset wholesale è stato caricato come DataFrame di pandas, mentre le medie e le deviazioni standard di ciascuna colonna di wholesale sono caricate come Series di pandas chiamate rispettivamente averages e std_devs. Assicurati di esplorarle nella console.
Questo esercizio fa parte del corso
Machine Learning per il marketing con Python
Istruzioni dell'esercizio
- Crea una lista con i nomi delle colonne di
wholesalee un'altra con i valori ordinati da 0 al numero di colonne inwholesale. - Traccia
averagesin grigio estd_devsin arancione, regolando l'asse x di 0.2. - Aggiungi
x_ixcome tacche ex_namescome etichette e ruotale di 90 gradi. - Aggiungi la legenda e visualizza il grafico.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Create column names list and same length integer list
x_names = wholesale.___
x_ix = np.arange(wholesale.shape[1])
# Plot the averages data in gray and standard deviations in orange
plt.bar(x=x_ix-___, height=averages, color='grey', label='Average', width=0.4)
plt.bar(x=x_ix+___, height=std_devs, color='orange', label='Standard Deviation', width=0.4)
# Add x-axis labels and rotate
plt.xticks(ticks=___, labels=x_names, rotation=90)
# Add the legend and display the chart
plt.legend()
plt.___()