Comprendre les différences entre les variables
Vous allez maintenant analyser les moyennes et les écarts types de chaque variable en les représentant dans un diagramme en barres. C’est une étape complémentaire à la précédente, car vous allez explorer visuellement les différences d’échelle et de variance entre les variables.
La bibliothèque pandas est chargée sous le nom pd et matplotlib.pyplot sous le nom plt. Le jeu de données wholesale a été chargé dans un DataFrame pandas, et les moyennes et écarts types de chaque colonne de wholesale sont chargés dans des objets pandas Series nommés respectivement averages et std_devs. Pensez à les explorer dans la console.
Cet exercice fait partie du cours
Machine Learning pour le marketing en Python
Instructions
- Créez une liste avec les noms de colonnes de
wholesaleet une autre avec des valeurs triées de 0 jusqu’au nombre de colonnes dewholesale. - Tracez
averagesen gris etstd_devsen orange, en ajustant l’axe des x de 0,2. - Ajoutez
x_ixcomme graduations etx_namescomme étiquettes et veillez à les faire pivoter de 90 degrés. - Ajoutez la légende et affichez le graphique.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Create column names list and same length integer list
x_names = wholesale.___
x_ix = np.arange(wholesale.shape[1])
# Plot the averages data in gray and standard deviations in orange
plt.bar(x=x_ix-___, height=averages, color='grey', label='Average', width=0.4)
plt.bar(x=x_ix+___, height=std_devs, color='orange', label='Standard Deviation', width=0.4)
# Add x-axis labels and rotate
plt.xticks(ticks=___, labels=x_names, rotation=90)
# Add the legend and display the chart
plt.legend()
plt.___()