1. Learn
  2. /
  3. Cursuri
  4. /
  5. Curățarea datelor în Python

Connected

exercițiu

Înapoi în viitor

Un nou update al pipeline-ului de date care alimentează DataFrame-ul ride_sharing a fost actualizat pentru a înregistra data fiecărei curse. Această informație este stocată în coloana ride_date, de tipul object, care reprezintă șiruri de caractere în pandas.

A fost descoperit un bug care înregistra cursele efectuate astăzi ca și cum ar fi avut loc anul viitor. Pentru a remedia această problemă, vei identifica toate valorile din coloana ride_date care se află în viitor și vei seta valoarea maximă posibilă a acestei coloane la data de astăzi. Înainte de asta, va trebui să convertești ride_date într-un obiect de tip datetime.

Pachetul datetime a fost importat ca dt, alături de toate pachetele folosite până acum.

Instrucțiuni

100 XP
  • Convertește ride_date într-un obiect de tip datetime folosind to_datetime(), apoi convertește obiectul datetime într-un date și stochează rezultatul în coloana ride_dt.
  • Creează variabila today, care stochează data de astăzi folosind funcția dt.date.today().
  • Pentru toate valorile din ride_dt care se află în viitor, setează-le la data de astăzi.
  • Afișează data maximă din coloana ride_dt.