Comprendre les différences entre les variables

Vous allez maintenant analyser les moyennes et les écarts types de chaque variable en les représentant dans un diagramme en barres. C’est une étape complémentaire à la précédente, car vous allez explorer visuellement les différences d’échelle et de variance entre les variables.

La bibliothèque pandas est chargée sous le nom pd et matplotlib.pyplot sous le nom plt. Le jeu de données wholesale a été chargé dans un DataFrame pandas, et les moyennes et écarts types de chaque colonne de wholesale sont chargés dans des objets pandas Series nommés respectivement averages et std_devs. Pensez à les explorer dans la console.

Cet exercice fait partie du cours

<cours>Machine Learning pour le marketing en Python</cours>

Voir le cours

Instructions de l’exercice

Créez une liste avec les noms de colonnes de wholesale et une autre avec des valeurs triées de 0 jusqu’au nombre de colonnes de wholesale.
Tracez averages en gris et std_devs en orange, en ajustant l’axe des x de 0,2.
Ajoutez x_ix comme graduations et x_names comme étiquettes et veillez à les faire pivoter de 90 degrés.
Ajoutez la légende et affichez le graphique.

Exercice interactif pratique

Essayez cet exercice en complétant ce code d’exemple.

# Create column names list and same length integer list
x_names = wholesale.___
x_ix = np.arange(wholesale.shape[1])

# Plot the averages data in gray and standard deviations in orange 
plt.bar(x=x_ix-___, height=averages, color='grey', label='Average', width=0.4)
plt.bar(x=x_ix+___, height=std_devs, color='orange', label='Standard Deviation', width=0.4)

# Add x-axis labels and rotate
plt.xticks(ticks=___, labels=x_names, rotation=90)

# Add the legend and display the chart
plt.legend()
plt.___()

Modifier et exécuter le code