CommencerCommencer gratuitement

Retour vers le futur

Une nouvelle mise à jour du pipeline de données alimentant le DataFrame « ride_sharing » a été effectuée afin d'enregistrer la date de chaque trajet. Ces informations sont stockées dans la colonne « ride_date » de type « object », qui représente des chaînes de caractères dans « pandas ».

Un bug a été détecté qui reliait les trajets effectués aujourd'hui à ceux effectués l'année prochaine. Pour résoudre ce problème, veuillez identifier toutes les occurrences de la colonne « ride_date » qui se produiront à l'avenir et définir la valeur maximale possible de cette colonne à la date d'aujourd'hui. Avant de procéder, il est nécessaire de convertir l'objet ride_date en un objet datetime.

Le package datetime a été importé sous le nom dt, aux côtés de tous les packages que vous avez utilisés jusqu'à présent.

Cet exercice fait partie du cours

Nettoyage des données en Python

Afficher le cours

Instructions

  • Veuillez convertir ride_date en un objet datetime à l'aide de to_datetime(), puis convertir l'objet datetime en un objet date et le stocker dans la colonne ride_dt.
  • Créez la variable today, qui stocke la date du jour à l'aide de la fonction dt.date.today().
  • Pour toutes les instances futures d'ride_dt, veuillez les définir à la date d'aujourd'hui.
  • Veuillez imprimer la date maximale dans la colonne « ride_dt ».

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Convert ride_date to date
ride_sharing['ride_dt'] = pd.____(____['____']).dt.date

# Save today's date
today = ____

# Set all in the future to today's date
ride_sharing.____[____['____'] > ____, '____'] = ____

# Print maximum of ride_dt column
print(ride_sharing['ride_dt'].____())
Modifier et exécuter le code