1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Čištění dat v Pythonu

Connected

cvičení

Zpátky do budoucnosti

Data pipeline napojená na DataFrame ride_sharing byla aktualizována tak, aby zaznamenávala datum každé jízdy. Tato informace je uložena ve sloupci ride_date typu object, který v pandas reprezentuje řetězce.

Byla objevena chyba, kvůli které se jízdy uskutečněné dnes evidovaly jako jízdy příštího roku. Aby ses to opravil/a, najdeš všechny záznamy ve sloupci ride_date, které spadají do budoucnosti, a nastavíš maximální povolenou hodnotu tohoto sloupce na dnešní datum. Nejdřív ale budeš muset převést ride_date na objekt datetime.

Balíček datetime je naimportovaný jako dt, spolu se všemi ostatními balíčky, které jsi dosud používal/a.

Pokyny

100 XP
  • Převeď ride_date na objekt datetime pomocí to_datetime(), poté ho převeď na typ date a výsledek ulož do sloupce ride_dt.
  • Vytvoř proměnnou today, která bude uchovávat dnešní datum – použij funkci dt.date.today().
  • Všechny záznamy ve sloupci ride_dt, které spadají do budoucnosti, nastav na dnešní datum.
  • Vypiš maximální datum ve sloupci ride_dt.