Ritorno al futuro
Un nuovo aggiornamento della pipeline dati che alimenta il DataFrame ride_sharing registra la data di ogni corsa. Questa informazione è salvata nella colonna ride_date di tipo object, che in pandas rappresenta stringhe.
È stato scoperto un bug che riportava le corse effettuate oggi come se fossero state effettuate l'anno prossimo. Per risolverlo, troverai tutte le occorrenze della colonna ride_date che cadono in qualsiasi momento nel futuro e imposterai il valore massimo possibile di questa colonna alla data di oggi. Prima di farlo, devi convertire ride_date in un oggetto datetime.
Il pacchetto datetime è stato importato come dt, insieme a tutti i pacchetti che hai utilizzato finora.
Questo esercizio fa parte del corso
Pulizia dei dati in Python
Istruzioni dell'esercizio
- Converte
ride_datein un oggettodatetimeusandoto_datetime(), poi trasforma l'oggettodatetimein unadatee salvalo nella colonnaride_dt. - Crea la variabile
today, che memorizza la data di oggi usando la funzionedt.date.today(). - Per tutte le occorrenze di
ride_dtnel futuro, imposta il valore alla data di oggi. - Stampa la data massima nella colonna
ride_dt.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Convert ride_date to date
ride_sharing['ride_dt'] = pd.____(____['____']).dt.date
# Save today's date
today = ____
# Set all in the future to today's date
ride_sharing.____[____['____'] > ____, '____'] = ____
# Print maximum of ride_dt column
print(ride_sharing['ride_dt'].____())