Retour vers le futur
Une nouvelle mise à jour du pipeline de données alimentant le DataFrame « ride_sharing
» a été effectuée afin d'enregistrer la date de chaque trajet. Ces informations sont stockées dans la colonne « ride_date
» de type « object
», qui représente des chaînes de caractères dans « pandas
».
Un bug a été détecté qui reliait les trajets effectués aujourd'hui à ceux effectués l'année prochaine. Pour résoudre ce problème, veuillez identifier toutes les occurrences de la colonne « ride_date
» qui se produiront à l'avenir et définir la valeur maximale possible de cette colonne à la date d'aujourd'hui. Avant de procéder, il est nécessaire de convertir l'objet ride_date
en un objet datetime
.
Le package datetime
a été importé sous le nom dt
, aux côtés de tous les packages que vous avez utilisés jusqu'à présent.
Cet exercice fait partie du cours
Nettoyage des données en Python
Instructions
- Veuillez convertir
ride_date
en un objetdatetime
à l'aide deto_datetime()
, puis convertir l'objetdatetime
en un objetdate
et le stocker dans la colonneride_dt
. - Créez la variable
today
, qui stocke la date du jour à l'aide de la fonctiondt.date.today()
. - Pour toutes les instances futures d'
ride_dt
, veuillez les définir à la date d'aujourd'hui. - Veuillez imprimer la date maximale dans la colonne «
ride_dt
».
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Convert ride_date to date
ride_sharing['ride_dt'] = pd.____(____['____']).dt.date
# Save today's date
today = ____
# Set all in the future to today's date
ride_sharing.____[____['____'] > ____, '____'] = ____
# Print maximum of ride_dt column
print(ride_sharing['ride_dt'].____())