Mediana e desvio padrão de 360 dias para dados de ozônio de Nova York desde 2000

O último vídeo também mostrou a você como calcular várias estatísticas contínuas usando o método .agg(), semelhante ao .groupby().

Vamos examinar mais de perto o histórico da qualidade do ar do site NYC usando os dados de ozônio que você já viu antes. Os dados diários são muito voláteis, portanto, o uso de uma média móvel de longo prazo pode ajudar a revelar uma tendência de longo prazo.

Você usará uma janela móvel de 360 dias e o site .agg() para calcular a média móvel e o desvio padrão dos valores médios diários de ozônio desde 2000.

Este exercício faz parte do curso

Manipulação de dados de séries temporais em Python

Ver Curso

Instruções de exercício

Já importamos pandas como pd e matplotlib.pyplot como plt.

  • Use pd.read_csv() para importar 'ozone.csv', criando um DateTimeIndex a partir da coluna 'date' usando parse_dates e index_col, atribua o resultado a data e elimine os valores ausentes usando .dropna().
  • Selecione a coluna 'Ozone' e crie uma janela .rolling() usando 360 períodos, aplique .agg() para calcular mean e std e atribua isso a rolling_stats.
  • Use .join() para concatenar data com rolling_stats e atribua a stats.
  • Trace stats usando subplots.

Exercício interativo prático

Experimente este exercício preenchendo este código de exemplo.

# Import and inspect ozone data here
data = ____

# Calculate the rolling mean and std here
rolling_stats = ____

# Join rolling_stats with ozone data
stats = ____

# Plot stats