CommencerCommencez gratuitement

Retour vers le futur

Une nouvelle mise à jour du pipeline de données alimentant le DataFrame ride_sharing a été effectuée afin d'enregistrer la date de chaque trajet. Ces informations sont stockées dans la colonne ride_date de type object, qui représente des chaînes de caractères dans pandas.

Un bug a été détecté. Celui-ci indiquait la date des trajets effectués aujourd'hui comme effectués l'année prochaine. Pour résoudre ce problème, identifiez toutes les occurrences de la colonne ride_date qui se produisent dans l'avenir et définissez la valeur maximale possible de cette colonne à la date d'aujourd'hui. Avant de procéder, il est nécessaire de convertir l'objet ride_date en un objet datetime.

Le package datetime a été importé sous le nom dt, aux côtés de tous les packages que vous avez utilisés jusqu'à présent.

Cet exercice fait partie du cours

<cours>Nettoyage des données en Python</cours>
Voir le cours

Instructions de l’exercice

  • Convertissez ride_date en un objet datetime à l'aide de to_datetime(), puis convertissez l'objet datetime en un objet date et stockez-le dans la colonne ride_dt.
  • Créez la variable today, qui stocke la date du jour à l'aide de la fonction dt.date.today().
  • Pour toutes les instances futures de ride_dt, veuillez les définir à la date d'aujourd'hui.
  • Affichez la date maximale dans la colonne ride_dt.

Exercice interactif pratique

Essayez cet exercice en complétant ce code d’exemple.

# Convert ride_date to date
ride_sharing['ride_dt'] = pd.____(____['____']).dt.date

# Save today's date
today = ____

# Set all in the future to today's date
ride_sharing.____[____['____'] > ____, '____'] = ____

# Print maximum of ride_dt column
print(ride_sharing['ride_dt'].____())
Modifier et exécuter le code