Aan de slagGa gratis aan de slag

Terug naar de toekomst

Een nieuwe update van de datapijplijn die de ride_sharing-DataFrame vult, registreert nu de datum van elke rit. Deze informatie staat in de kolom ride_date van het type object, wat in pandas strings voorstelt.

Er is een bug ontdekt waardoor ritten die vandaag zijn gemaakt, werden doorgegeven als ritten van volgend jaar. Om dit te verhelpen, ga je alle waarden in de kolom ride_date vinden die in de toekomst liggen en de maximale mogelijke waarde van deze kolom instellen op de datum van vandaag. Voordat je dit doet, moet je ride_date omzetten naar een datetime-object.

Het pakket datetime is geïmporteerd als dt, naast alle pakketten die je tot nu toe hebt gebruikt.

Deze oefening maakt deel uit van de cursus

Data opschonen in Python

Cursus bekijken

Oefeninstructies

  • Zet ride_date om naar een datetime-object met to_datetime() en zet dit datetime-object vervolgens om naar een date en sla het op in de kolom ride_dt.
  • Maak de variabele today, die de datum van vandaag opslaat met de functie dt.date.today().
  • Stel alle waarden van ride_dt die in de toekomst liggen in op de datum van vandaag.
  • Print de maximale datum in de kolom ride_dt.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Convert ride_date to date
ride_sharing['ride_dt'] = pd.____(____['____']).dt.date

# Save today's date
today = ____

# Set all in the future to today's date
ride_sharing.____[____['____'] > ____, '____'] = ____

# Print maximum of ride_dt column
print(ride_sharing['ride_dt'].____())
Code bewerken en uitvoeren