Variância e desvio-padrão
A variância e o desvio-padrão são duas das formas mais comuns de medir a dispersão de uma variável, e você praticará o cálculo delas neste exercício. A dispersão é importante, pois pode ajudar a informar as expectativas. Por exemplo, se um vendedor vende uma média de 20 produtos por dia, mas tem um desvio-padrão de 10 produtos, provavelmente haverá dias em que ele venderá 40 produtos, mas também dias em que venderá apenas um ou dois. Informações como essas são importantes, especialmente ao fazer previsões.
pandas
foi importado como pd
, numpy
como np
, e matplotlib.pyplot
como plt
; o DataFrame food_consumption
também está disponível.
Este exercício faz parte do curso
Introdução à estatística em Python
Instruções de exercício
- Calcule a variação e o desvio padrão de
co2_emission
para cadafood_category
com os métodos.groupby()
e.agg()
; compare os valores da variação e do desvio padrão. - Crie um histograma de
co2_emission
parabeef
emfood_category
e mostre o gráfico. - Crie um histograma de
co2_emission
paraeggs
emfood_category
e mostre o gráfico.
Exercício interativo prático
Experimente este exercício preenchendo este código de exemplo.
# Print variance and sd of co2_emission for each food_category
print(food_consumption.____(____)[____].agg([____]))
# Create histogram of co2_emission for food_category 'beef'
food_consumption[____]['____'].____()
plt.show()
# Create histogram of co2_emission for food_category 'eggs'
food_consumption[____]['____'].____()
plt.show()