Criando variáveis defasadas no tempo
Em Machine Learning para séries temporais, é comum usar informações de pontos no tempo anteriores para prever um ponto subsequente.
Neste exercício, você vai “deslocar” seus dados brutos e visualizar os resultados. Você usará a série temporal de variação percentual que calculou no capítulo anterior, agora com uma janela bem curta. Uma janela curta é importante porque, em um cenário real, você quer prever as flutuações diárias de uma série temporal, não a variação ao longo de um período maior.
Este exercício faz parte do curso
Machine Learning para dados de séries temporais em Python
Instruções do exercício
- Use uma compreensão de dicionário para criar várias versões defasadas de
prices_percusando as defasagens especificadas emshifts. - Converta o resultado em um DataFrame.
- Use o código fornecido para visualizar os resultados.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# These are the "time lags"
shifts = np.arange(1, 11).astype(int)
# Use a dictionary comprehension to create name: value pairs, one pair per shift
shifted_data = {"lag_{}_day".format(day_shift): prices_perc.____(____) for day_shift in shifts}
# Convert into a DataFrame for subsequent use
prices_perc_shifted = ____(shifted_data)
# Plot the first 100 samples of each
ax = prices_perc_shifted.iloc[:100].plot(cmap=plt.cm.viridis)
prices_perc.iloc[:100].plot(color='r', lw=2)
ax.legend(loc='best')
plt.show()