IniziaInizia gratis

Ritorno al futuro

Un nuovo aggiornamento della pipeline dati che alimenta il DataFrame ride_sharing registra la data di ogni corsa. Questa informazione è salvata nella colonna ride_date di tipo object, che in pandas rappresenta stringhe.

È stato scoperto un bug che riportava le corse effettuate oggi come se fossero state effettuate l'anno prossimo. Per risolverlo, troverai tutte le occorrenze della colonna ride_date che cadono in qualsiasi momento nel futuro e imposterai il valore massimo possibile di questa colonna alla data di oggi. Prima di farlo, devi convertire ride_date in un oggetto datetime.

Il pacchetto datetime è stato importato come dt, insieme a tutti i pacchetti che hai utilizzato finora.

Questo esercizio fa parte del corso

Pulizia dei dati in Python

Visualizza il corso

Istruzioni dell'esercizio

  • Converte ride_date in un oggetto datetime usando to_datetime(), poi trasforma l'oggetto datetime in una date e salvalo nella colonna ride_dt.
  • Crea la variabile today, che memorizza la data di oggi usando la funzione dt.date.today().
  • Per tutte le occorrenze di ride_dt nel futuro, imposta il valore alla data di oggi.
  • Stampa la data massima nella colonna ride_dt.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Convert ride_date to date
ride_sharing['ride_dt'] = pd.____(____['____']).dt.date

# Save today's date
today = ____

# Set all in the future to today's date
ride_sharing.____[____['____'] > ____, '____'] = ____

# Print maximum of ride_dt column
print(ride_sharing['ride_dt'].____())
Modifica ed esegui il codice