Variance et écart-type
La variance et l’écart-type sont deux des moyens les plus courants de mesurer la dispersion d’une variable, et vous vous entraînerez à les calculer dans cet exercice. La dispersion est importante car elle peut contribuer à définir les attentes. Par exemple, si un vendeur vend en moyenne 20 produits par jour, mais que son écart-type est de 10 produits, il y aura probablement des jours où il vendra 40 produits, mais aussi des jours où il n’en vendra qu’un ou deux. Ce type d’information est important, surtout lorsqu’il s'agit de faire des prévisions.
pandas a été importé en tant que pd, numpy en tant que np, et matplotlib.pyplot en tant que plt. Le DataFrame food_consumption est également disponible.
Cet exercice fait partie du cours
Introduction aux statistiques en Python
Instructions
- Calculez la variance et l’écart-type de
co2_emissionpour chaque catégorie d’aliments (food_category) à l’aide des méthodes.groupby()et.agg(). puis comparez les valeurs de la variance et de l’écart-type. - Créez un histogramme de
co2_emissionpour la catégorie d’alimentsbeefet affichez le graphique. - Créez un histogramme de
co2_emissionpour la catégorie d’alimentseggset affichez le graphique.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Print variance and sd of co2_emission for each food_category
print(food_consumption.____('____')['____'].agg([____]))
# Create histogram of co2_emission for food_category 'beef'
food_consumption[____]['____'].____()
plt.show()
# Create histogram of co2_emission for food_category 'eggs'
plt.figure()
food_consumption[____]['____'].____()
plt.show()