Tijdreeksen slicen
Slicen is vooral handig voor tijdreeksen, omdat je vaak wilt filteren op een datumbereik. Voeg de kolom date toe aan de index en gebruik daarna .loc[] om een subset te maken. Het is belangrijk dat je datums in ISO 8601-indeling houdt: "yyyy-mm-dd" voor jaar-maand-dag, "yyyy-mm" voor jaar-maand en "yyyy" voor jaar.
Herinner je uit Hoofdstuk 1 dat je meerdere Booleaanse voorwaarden kunt combineren met logische operatoren, zoals &. Als je dit in één regel code wilt doen, zet je ronde haakjes () om elke voorwaarde.
pandas is geladen als pd en temperatures, zonder index, is beschikbaar.
Deze oefening maakt deel uit van de cursus
Datamanipulatie met pandas
Oefeninstructies
- Gebruik Booleaanse voorwaarden, niet
.isin()of.loc[], en de volledige datum"yyyy-mm-dd", om een subset vantemperatureste maken voor rijen waar de kolomdatein 2010 en 2011 valt, en print de resultaten. - Zet de index van
temperaturesop de kolomdateen sorteer deze. - Gebruik
.loc[]om een subset vantemperatures_indte maken voor rijen in 2010 en 2011. - Gebruik
.loc[]om een subset vantemperatures_indte maken voor rijen van August 2010 tot February 2011.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Use Boolean conditions to subset temperatures for rows in 2010 and 2011
temperatures_bool = ____[(____ >= ____) & (____ <= ____)]
print(temperatures_bool)
# Set date as the index and sort the index
temperatures_ind = temperatures.____.____
# Use .loc[] to subset temperatures_ind for rows in 2010 and 2011
print(____)
# Use .loc[] to subset temperatures_ind for rows from Aug 2010 to Feb 2011
print(____)