1. Learn
  2. /
  3. Courses
  4. /
  5. Nettoyage des données en Python

Connected

Exercise

Retour vers le futur

Une nouvelle mise à jour du pipeline de données alimentant le DataFrame ride_sharing a été déployée pour enregistrer la date de chaque course. Cette information est stockée dans la colonne ride_date de type object, qui représente des chaînes de caractères dans pandas.

Un bogue a été découvert : les courses effectuées aujourd’hui étaient enregistrées comme si elles avaient lieu l’an prochain. Pour corriger cela, vous allez repérer toutes les valeurs de la colonne ride_date qui se situent dans le futur et définir la valeur maximale possible de cette colonne à la date d’aujourd’hui. Avant de le faire, vous devez convertir ride_date en objet datetime.

Le module datetime a été importé sous le nom dt, en plus de tous les modules que vous avez utilisés jusqu’à maintenant.

Instructions

100 XP
  • Convertissez ride_date en objet datetime avec to_datetime(), puis convertissez cet objet datetime en date et enregistrez-le dans la colonne ride_dt.
  • Créez la variable today, qui contient la date d’aujourd’hui, en utilisant la fonction dt.date.today().
  • Pour toutes les valeurs de ride_dt situées dans le futur, remplacez-les par la date d’aujourd’hui.
  • Affichez la date maximale de la colonne ride_dt.