Retour vers le futur
Une nouvelle mise à jour du pipeline de données alimentant le DataFrame ride_sharing a été effectuée afin d'enregistrer la date de chaque trajet. Ces informations sont stockées dans la colonne ride_date de type object, qui représente des chaînes de caractères dans pandas.
Un bug a été détecté. Celui-ci indiquait la date des trajets effectués aujourd'hui comme effectués l'année prochaine. Pour résoudre ce problème, identifiez toutes les occurrences de la colonne ride_date qui se produisent dans l'avenir et définissez la valeur maximale possible de cette colonne à la date d'aujourd'hui. Avant de procéder, il est nécessaire de convertir l'objet ride_date en un objet datetime.
Le package datetime a été importé sous le nom dt, aux côtés de tous les packages que vous avez utilisés jusqu'à présent.
Cet exercice fait partie du cours
Nettoyage des données en Python
Instructions
- Convertissez
ride_dateen un objetdatetimeà l'aide deto_datetime(), puis convertissez l'objetdatetimeen un objetdateet stockez-le dans la colonneride_dt. - Créez la variable
today, qui stocke la date du jour à l'aide de la fonctiondt.date.today(). - Pour toutes les instances futures de
ride_dt, veuillez les définir à la date d'aujourd'hui. - Affichez la date maximale dans la colonne
ride_dt.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Convert ride_date to date
ride_sharing['ride_dt'] = pd.____(____['____']).dt.date
# Save today's date
today = ____
# Set all in the future to today's date
ride_sharing.____[____['____'] > ____, '____'] = ____
# Print maximum of ride_dt column
print(ride_sharing['ride_dt'].____())