Terug naar de toekomst
Een nieuwe update van de datapijplijn die de ride_sharing-DataFrame vult, registreert nu de datum van elke rit. Deze informatie staat in de kolom ride_date van het type object, wat in pandas strings voorstelt.
Er is een bug ontdekt waardoor ritten die vandaag zijn gemaakt, werden doorgegeven als ritten van volgend jaar. Om dit te verhelpen, ga je alle waarden in de kolom ride_date vinden die in de toekomst liggen en de maximale mogelijke waarde van deze kolom instellen op de datum van vandaag. Voordat je dit doet, moet je ride_date omzetten naar een datetime-object.
Het pakket datetime is geïmporteerd als dt, naast alle pakketten die je tot nu toe hebt gebruikt.
Deze oefening maakt deel uit van de cursus
Data opschonen in Python
Oefeninstructies
- Zet
ride_dateom naar eendatetime-object metto_datetime()en zet ditdatetime-object vervolgens om naar eendateen sla het op in de kolomride_dt. - Maak de variabele
today, die de datum van vandaag opslaat met de functiedt.date.today(). - Stel alle waarden van
ride_dtdie in de toekomst liggen in op de datum van vandaag. - Print de maximale datum in de kolom
ride_dt.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Convert ride_date to date
ride_sharing['ride_dt'] = pd.____(____['____']).dt.date
# Save today's date
today = ____
# Set all in the future to today's date
ride_sharing.____[____['____'] > ____, '____'] = ____
# Print maximum of ride_dt column
print(ride_sharing['ride_dt'].____())