Filtrar dados de séries temporais
Ao visualizar séries temporais, às vezes você pode querer ver apenas uma parte dos dados. A biblioteca pandas oferece métodos poderosos de indexação e filtragem que permitem extrair porções específicas de um DataFrame. Por exemplo, você pode filtrar todos os dados entre 1950 e 1960 no DataFrame discoveries especificando o seguinte intervalo de datas:
subset_data = discoveries['1950-01-01':'1960-01-01']
Observação: filtrar seus dados dessa forma só é possível se o índice do seu DataFrame contiver datas do tipo datetime. Caso contrário, a biblioteca pandas retornará uma mensagem de erro.
Este exercício faz parte do curso
Visualizing Time Series Data in Python
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Select the subset of data between 1945 and 1950
discoveries_subset_1 = discoveries['____':'____']
# Plot the time series in your DataFrame as a blue area chart
ax = discoveries_subset_1.____(color='blue', fontsize=15)
# Show plot
plt.show()