Varianz und Standardabweichung
Varianz und Standardabweichung sind zwei der gebräuchlichsten Methoden, um die Streuung einer Variablen zu messen, und du wirst in dieser Übung üben, sie zu berechnen. Die Streuung ist wichtig, da sie die Erwartungen beeinflussen kann. Wenn eine Verkäuferin oder ein Verkäufer zum Beispiel im Durchschnitt 20 Produkte pro Tag verkauft, aber eine Standardabweichung von 10 Produkten hat, wird es wahrscheinlich Tage geben, an denen sie oder er 40 Produkte verkauft, aber auch Tage, an denen sie oder er nur ein oder zwei Produkte verkauft. Solche Informationen sind wichtig, besonders wenn du Vorhersagen treffen willst.
pandas
wurde als pd
, numpy
als np
und matplotlib.pyplot
als plt
importiert; der food_consumption
DataFrame ist ebenfalls verfügbar.
Diese Übung ist Teil des Kurses
Einführung in die Statistik in Python
Anleitung zur Übung
- Berechne die Varianz und Standardabweichung von
co2_emission
für jedefood_category
mit den Methoden.groupby()
und.agg()
; vergleiche die Werte von Varianz und Standardabweichung. - Erstelle ein Histogramm von
co2_emission
für diebeef
infood_category
und zeige das Diagramm. - Erstelle ein Histogramm von
co2_emission
für dieeggs
infood_category
und zeige das Diagramm.
Interaktive Übung zum Anfassen
Probieren Sie diese Übung aus, indem Sie diesen Beispielcode ausführen.
# Print variance and sd of co2_emission for each food_category
print(food_consumption.____(____)[____].agg([____]))
# Create histogram of co2_emission for food_category 'beef'
food_consumption[____]['____'].____()
plt.show()
# Create histogram of co2_emission for food_category 'eggs'
food_consumption[____]['____'].____()
plt.show()