Zurück in die Zukunft
Eine neue Aktualisierung der Datenpipeline, die in den DataFrame ride_sharing
einfließt, registriert das Datum jeder Fahrt. Diese Informationen werden in der Spalte ride_date
vom Typ object
gespeichert, die Zeichenketten in pandas
repräsentiert.
Es wurde ein Fehler entdeckt, der Fahrten von heute als Fahrten im nächsten Jahr anzeigt. Um dies zu beheben, musst du alle Instanzen der Spalte ride_date
finden, die irgendwann in der Zukunft liegen, und den maximal möglichen Wert dieser Spalte auf das heutige Datum setzen. Bevor du das tust, musst du ride_date
in ein datetime
-Objekt umwandeln.
Das Paket datetime
wurde als dt
importiert, zusammen mit allen anderen Paketen, die du bisher benutzt hast.
Diese Übung ist Teil des Kurses
Datenbereinigung in Python
Anleitung zur Übung
- Konvertiere
ride_date
mitto_datetime()
in eindatetime
-Objekt, konvertiere dann dasdatetime
-Objekt zudate
und speichere es in der Spalteride_dt
. - Erstelle die Variable
today
, in der das heutige Datum gespeichert wird, indem du die Funktiondt.date.today()
verwendest. - Setze für alle Instanzen von
ride_dt
in der Zukunft das heutige Datum ein. - Drucke das maximale Datum in der Spalte
ride_dt
.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Convert ride_date to date
ride_sharing['ride_dt'] = pd.____(____['____']).dt.date
# Save today's date
today = ____
# Set all in the future to today's date
ride_sharing.____[____['____'] > ____, '____'] = ____
# Print maximum of ride_dt column
print(ride_sharing['ride_dt'].____())