Quantis de rolagem para a qualidade do ar diária em Nova York
No último vídeo, você aprendeu a calcular os quantis de rolagem para descrever as mudanças na dispersão de uma série temporal ao longo do tempo de uma forma que é menos sensível a outliers do que usar a média e o desvio padrão.
Vamos calcular os quantis contínuos - em 10%, 50% (mediana) e 90% - da distribuição da concentração média diária de ozônio em NYC usando uma janela contínua de 360 dias.
Este exercício faz parte do curso
Manipulação de dados de séries temporais em Python
Instruções de exercício
Já importamos pandas
como pd
e matplotlib.pyplot
como plt
. Também carregamos os dados de ozônio de 2000 a 2017 na variável data
.
- Aplique
.resample()
com frequência diária'D'
adata
e aplique.interpolate()
para preencher os valores ausentes e reatribua adata
. - Inspecione o resultado usando
.info()
. - Crie uma janela
.rolling()
usando 360 períodos, selecione a coluna'Ozone'
e atribua o resultado arolling
. - Insira três novas colunas,
'q10'
,'q50'
e'q90'
emdata
, calculando os respectivos quantis a partir derolling
. - Plot
data
.
Exercício interativo prático
Experimente este exercício preenchendo este código de exemplo.
# Resample, interpolate and inspect ozone data here
data = ____
# Create the rolling window
rolling = ____
# Insert the rolling quantiles to the monthly returns
data['q10'] = ____
data['q50'] = ____
data['q90'] = ____
# Plot the data