Mediana e desvio padrão de 360 dias para dados de ozônio de Nova York desde 2000
O último vídeo também mostrou a você como calcular várias estatísticas contínuas usando o método .agg()
, semelhante ao .groupby()
.
Vamos examinar mais de perto o histórico da qualidade do ar do site NYC usando os dados de ozônio que você já viu antes. Os dados diários são muito voláteis, portanto, o uso de uma média móvel de longo prazo pode ajudar a revelar uma tendência de longo prazo.
Você usará uma janela móvel de 360 dias e o site .agg()
para calcular a média móvel e o desvio padrão dos valores médios diários de ozônio desde 2000.
Este exercício faz parte do curso
Manipulação de dados de séries temporais em Python
Instruções de exercício
Já importamos pandas
como pd
e matplotlib.pyplot
como plt
.
- Use
pd.read_csv()
para importar'ozone.csv'
, criando umDateTimeIndex
a partir da coluna'date'
usandoparse_dates
eindex_col
, atribua o resultado adata
e elimine os valores ausentes usando.dropna()
. - Selecione a coluna
'Ozone'
e crie uma janela.rolling()
usando 360 períodos, aplique.agg()
para calcularmean
estd
e atribua isso arolling_stats
. - Use
.join()
para concatenardata
comrolling_stats
e atribua astats
. - Trace
stats
usandosubplots
.
Exercício interativo prático
Experimente este exercício preenchendo este código de exemplo.
# Import and inspect ozone data here
data = ____
# Calculate the rolling mean and std here
rolling_stats = ____
# Join rolling_stats with ozone data
stats = ____
# Plot stats