Mediana e desvio padrão de 360 dias para dados de ozônio de Nova York desde 2000
O último vídeo também mostrou a você como calcular várias estatísticas contínuas usando o método .agg(), semelhante ao .groupby().
Vamos examinar mais de perto o histórico da qualidade do ar do site NYC usando os dados de ozônio que você já viu antes. Os dados diários são muito voláteis, portanto, o uso de uma média móvel de longo prazo pode ajudar a revelar uma tendência de longo prazo.
Você usará uma janela móvel de 360 dias e o site .agg() para calcular a média móvel e o desvio padrão dos valores médios diários de ozônio desde 2000.
Este exercício faz parte do curso
Manipulação de dados de séries temporais em Python
Instruções do exercício
Já importamos pandas como pd e matplotlib.pyplot como plt.
- Use
pd.read_csv()para importar'ozone.csv', criando umDateTimeIndexa partir da coluna'date'usandoparse_dateseindex_col, atribua o resultado adatae elimine os valores ausentes usando.dropna(). - Selecione a coluna
'Ozone'e crie uma janela.rolling()usando 360 períodos, aplique.agg()para calcularmeanestde atribua isso arolling_stats. - Use
.join()para concatenardatacomrolling_statse atribua astats. - Trace
statsusandosubplots.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Import and inspect ozone data here
data = ____
# Calculate the rolling mean and std here
rolling_stats = ____
# Join rolling_stats with ozone data
stats = ____
# Plot stats