Aan de slagGa gratis aan de slag

Tijdreeksen slicen

Slicen is vooral handig voor tijdreeksen, omdat je vaak wilt filteren op een datumbereik. Voeg de kolom date toe aan de index en gebruik daarna .loc[] om een subset te maken. Het is belangrijk dat je datums in ISO 8601-indeling houdt: "yyyy-mm-dd" voor jaar-maand-dag, "yyyy-mm" voor jaar-maand en "yyyy" voor jaar.

Herinner je uit Hoofdstuk 1 dat je meerdere Booleaanse voorwaarden kunt combineren met logische operatoren, zoals &. Als je dit in één regel code wilt doen, zet je ronde haakjes () om elke voorwaarde.

pandas is geladen als pd en temperatures, zonder index, is beschikbaar.

Deze oefening maakt deel uit van de cursus

Datamanipulatie met pandas

Cursus bekijken

Oefeninstructies

  • Gebruik Booleaanse voorwaarden, niet .isin() of .loc[], en de volledige datum "yyyy-mm-dd", om een subset van temperatures te maken voor rijen waar de kolom date in 2010 en 2011 valt, en print de resultaten.
  • Zet de index van temperatures op de kolom date en sorteer deze.
  • Gebruik .loc[] om een subset van temperatures_ind te maken voor rijen in 2010 en 2011.
  • Gebruik .loc[] om een subset van temperatures_ind te maken voor rijen van August 2010 tot February 2011.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Use Boolean conditions to subset temperatures for rows in 2010 and 2011
temperatures_bool = ____[(____ >= ____) & (____ <= ____)]
print(temperatures_bool)

# Set date as the index and sort the index
temperatures_ind = temperatures.____.____

# Use .loc[] to subset temperatures_ind for rows in 2010 and 2011
print(____)

# Use .loc[] to subset temperatures_ind for rows from Aug 2010 to Feb 2011
print(____)
Code bewerken en uitvoeren