Fatiamento de séries temporais
O fatiamento é útil sobretudo nas séries temporais, pois é comum querer filtrar os dados em um intervalo de datas. Adicione a coluna date
ao índice e, em seguida, use .loc[]
para criar o subconjunto. O importante é manter as datas no formato ISO 8601, ou seja, "yyyy-mm-dd"
para ano-mês-dia, "yyyy-mm"
para ano-mês e "yyyy"
para ano.
Lembre-se de que, no Capítulo 1, vimos que é possível combinar várias condições booleanas usando operadores lógicos, como &
. Para fazer isso em apenas uma linha de código, é preciso incluir cada condição entre parênteses ()
.
pandas
foi carregado como pd
e temperatures
, sem índice, já está disponível.
Este exercício faz parte do curso
Manipulação de dados com o pandas
Instruções de exercício
- Use condições booleanas, não
.isin()
ou.loc[]
, e a data completa"yyyy-mm-dd"
para criar um subconjunto detemperatures
com as linhas em que a colunadate
está em 2010 e 2011 e imprima os resultados. - Defina o índice de
temperatures
como sendo a colunadate
e classifique-o. - Use
.loc[]
para criar um subconjunto detemperatures_ind
com as linhas de 2010 e 2011. - Use
.loc[]
para criar um subconjunto detemperatures_ind
com as linhas de agosto de 2010 a fevereiro de 2011.
Exercício interativo prático
Experimente este exercício preenchendo este código de exemplo.
# Use Boolean conditions to subset temperatures for rows in 2010 and 2011
temperatures_bool = ____[(____ >= ____) & (____ <= ____)]
print(temperatures_bool)
# Set date as the index and sort the index
temperatures_ind = temperatures.____.____
# Use .loc[] to subset temperatures_ind for rows in 2010 and 2011
print(____)
# Use .loc[] to subset temperatures_ind for rows from Aug 2010 to Feb 2011
print(____)