Fatiamento de séries temporais
O fatiamento é útil sobretudo nas séries temporais, pois é comum querer filtrar os dados em um intervalo de datas. Adicione a coluna date ao índice e, em seguida, use .loc[] para criar o subconjunto. O importante é manter as datas no formato ISO 8601, ou seja, "yyyy-mm-dd" para ano-mês-dia, "yyyy-mm" para ano-mês e "yyyy" para ano.
Lembre-se de que, no Capítulo 1, vimos que é possível combinar várias condições booleanas usando operadores lógicos, como &. Para fazer isso em apenas uma linha de código, é preciso incluir cada condição entre parênteses ().
pandas foi carregado como pd e temperatures, sem índice, já está disponível.
Este exercício faz parte do curso
Manipulação de dados com o pandas
Instruções do exercício
- Use condições booleanas, não
.isin()ou.loc[], e a data completa"yyyy-mm-dd"para criar um subconjunto detemperaturescom as linhas em que a colunadatecorresponde a 2010 e 2011 e imprima os resultados. - Defina o índice de
temperaturescomo sendo a colunadatee classifique-o. - Use
.loc[]para criar um subconjunto detemperatures_indcom as linhas de 2010 e 2011. - Use
.loc[]para criar um subconjunto detemperatures_indcom as linhas de August 2010 a February 2011.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Use Boolean conditions to subset temperatures for rows in 2010 and 2011
temperatures_bool = ____[(____ >= ____) & (____ <= ____)]
print(temperatures_bool)
# Set date as the index and sort the index
temperatures_ind = temperatures.____.____
# Use .loc[] to subset temperatures_ind for rows in 2010 and 2011
print(____)
# Use .loc[] to subset temperatures_ind for rows from Aug 2010 to Feb 2011
print(____)