1. Nauka
  2. /
  3. Kursy
  4. /
  5. Czyszczenie danych w Pythonie

Connected

ćwiczenie

Powrót do przyszłości

Potok danych zasilający ramkę danych ride_sharing został zaktualizowany – teraz rejestruje datę każdego przejazdu. Informacja ta jest przechowywana w kolumnie ride_date o typie object, który w pandas reprezentuje łańcuchy znakowe.

Wykryto błąd, który powodował, że przejazdy odbyte dzisiaj były rejestrowane jako przyszłoroczne. Aby to naprawić, znajdziesz wszystkie wpisy w kolumnie ride_date z datą z przyszłości i ustawisz maksymalną dopuszczalną wartość tej kolumny na dzisiejszą datę. Wcześniej musisz przekonwertować kolumnę ride_date na obiekt datetime.

Pakiet datetime został zaimportowany jako dt, wraz ze wszystkimi innymi pakietami używanymi w tym rozdziale.

Instrukcje

100 XP
  • Przekonwertuj ride_date na obiekt datetime za pomocą to_datetime(), a następnie zamień obiekt datetime na typ date i zapisz wynik w kolumnie ride_dt.
  • Utwórz zmienną today, która przechowuje dzisiejszą datę – użyj do tego funkcji dt.date.today().
  • Dla wszystkich wpisów w kolumnie ride_dt z datą z przyszłości ustaw ich wartość na dzisiejszą datę.
  • Wyświetl maksymalną datę w kolumnie ride_dt.