ComeçarComece gratuitamente

Fatiamento de séries temporais

O fatiamento é útil sobretudo nas séries temporais, pois é comum querer filtrar os dados em um intervalo de datas. Adicione a coluna date ao índice e, em seguida, use .loc[] para criar o subconjunto. O importante é manter as datas no formato ISO 8601, ou seja, "yyyy-mm-dd" para ano-mês-dia, "yyyy-mm" para ano-mês e "yyyy" para ano.

Lembre-se de que, no Capítulo 1, vimos que é possível combinar várias condições booleanas usando operadores lógicos, como &. Para fazer isso em apenas uma linha de código, é preciso incluir cada condição entre parênteses ().

pandas foi carregado como pd e temperatures, sem índice, já está disponível.

Este exercício faz parte do curso

Manipulação de dados com o pandas

Ver Curso

Instruções de exercício

  • Use condições booleanas, não .isin() ou .loc[], e a data completa "yyyy-mm-dd" para criar um subconjunto de temperatures com as linhas em que a coluna date está em 2010 e 2011 e imprima os resultados.
  • Defina o índice de temperatures como sendo a coluna date e classifique-o.
  • Use .loc[] para criar um subconjunto de temperatures_ind com as linhas de 2010 e 2011.
  • Use .loc[] para criar um subconjunto de temperatures_ind com as linhas de agosto de 2010 a fevereiro de 2011.

Exercício interativo prático

Experimente este exercício preenchendo este código de exemplo.

# Use Boolean conditions to subset temperatures for rows in 2010 and 2011
temperatures_bool = ____[(____ >= ____) & (____ <= ____)]
print(temperatures_bool)

# Set date as the index and sort the index
temperatures_ind = temperatures.____.____

# Use .loc[] to subset temperatures_ind for rows in 2010 and 2011
print(____)

# Use .loc[] to subset temperatures_ind for rows from Aug 2010 to Feb 2011
print(____)
Editar e executar código