CommencerCommencer gratuitement

Retour vers le futur

Une nouvelle mise à jour du pipeline de données alimentant le DataFrame ride_sharing a été effectuée afin d'enregistrer la date de chaque trajet. Ces informations sont stockées dans la colonne ride_date de type object, qui représente des chaînes de caractères dans pandas.

Un bug a été détecté. Celui-ci indiquait la date des trajets effectués aujourd'hui comme effectués l'année prochaine. Pour résoudre ce problème, identifiez toutes les occurrences de la colonne ride_date qui se produisent dans l'avenir et définissez la valeur maximale possible de cette colonne à la date d'aujourd'hui. Avant de procéder, il est nécessaire de convertir l'objet ride_date en un objet datetime.

Le package datetime a été importé sous le nom dt, aux côtés de tous les packages que vous avez utilisés jusqu'à présent.

Cet exercice fait partie du cours

Nettoyage des données en Python

Afficher le cours

Instructions

  • Convertissez ride_date en un objet datetime à l'aide de to_datetime(), puis convertissez l'objet datetime en un objet date et stockez-le dans la colonne ride_dt.
  • Créez la variable today, qui stocke la date du jour à l'aide de la fonction dt.date.today().
  • Pour toutes les instances futures de ride_dt, veuillez les définir à la date d'aujourd'hui.
  • Affichez la date maximale dans la colonne ride_dt.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Convert ride_date to date
ride_sharing['ride_dt'] = pd.____(____['____']).dt.date

# Save today's date
today = ____

# Set all in the future to today's date
ride_sharing.____[____['____'] > ____, '____'] = ____

# Print maximum of ride_dt column
print(ride_sharing['ride_dt'].____())
Modifier et exécuter le code