Varianz und Standardabweichung
Varianz und Standardabweichung sind zwei der gebräuchlichsten Methoden, um die Streuung einer Variablen zu messen, und du wirst in dieser Übung üben, sie zu berechnen. Die Streuung ist wichtig, da sie die Erwartungen beeinflussen kann. Wenn eine Verkäuferin oder ein Verkäufer zum Beispiel im Durchschnitt 20 Produkte pro Tag verkauft, aber eine Standardabweichung von 10 Produkten hat, wird es wahrscheinlich Tage geben, an denen sie oder er 40 Produkte verkauft, aber auch Tage, an denen sie oder er nur ein oder zwei Produkte verkauft. Solche Informationen sind wichtig, besonders wenn du Vorhersagen treffen willst.
pandas wurde als pd, numpy als np und matplotlib.pyplot als plt importiert; der DataFrame food_consumption ist ebenfalls verfügbar.
Diese Übung ist Teil des Kurses
Einführung in die Statistik in Python
Anleitung zur Übung
- Berechne die Varianz und Standardabweichung von
co2_emissionfür jedefood_categorymit den Methoden.groupby()und.agg(); vergleiche die Werte von Varianz und Standardabweichung. - Erstelle ein Histogramm von
co2_emissionfürbeefinfood_categoryund lasse das Diagramm anzeigen. - Erstelle ein Histogramm von
co2_emissionfüreggsinfood_categoryund lasse das Diagramm anzeigen.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Print variance and sd of co2_emission for each food_category
print(food_consumption.____('____')['____'].agg([____]))
# Create histogram of co2_emission for food_category 'beef'
food_consumption[____]['____'].____()
plt.show()
# Create histogram of co2_emission for food_category 'eggs'
plt.figure()
food_consumption[____]['____'].____()
plt.show()