ComeçarComece de graça

Criando variáveis defasadas no tempo

Em Machine Learning para séries temporais, é comum usar informações de pontos no tempo anteriores para prever um ponto subsequente.

Neste exercício, você vai “deslocar” seus dados brutos e visualizar os resultados. Você usará a série temporal de variação percentual que calculou no capítulo anterior, agora com uma janela bem curta. Uma janela curta é importante porque, em um cenário real, você quer prever as flutuações diárias de uma série temporal, não a variação ao longo de um período maior.

Este exercício faz parte do curso

Machine Learning para dados de séries temporais em Python

Ver curso

Instruções do exercício

  • Use uma compreensão de dicionário para criar várias versões defasadas de prices_perc usando as defasagens especificadas em shifts.
  • Converta o resultado em um DataFrame.
  • Use o código fornecido para visualizar os resultados.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# These are the "time lags"
shifts = np.arange(1, 11).astype(int)

# Use a dictionary comprehension to create name: value pairs, one pair per shift
shifted_data = {"lag_{}_day".format(day_shift): prices_perc.____(____) for day_shift in shifts}

# Convert into a DataFrame for subsequent use
prices_perc_shifted = ____(shifted_data)

# Plot the first 100 samples of each
ax = prices_perc_shifted.iloc[:100].plot(cmap=plt.cm.viridis)
prices_perc.iloc[:100].plot(color='r', lw=2)
ax.legend(loc='best')
plt.show()
Editar e executar o código