1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Làm sạch dữ liệu với Python

Connected

Bài tập

Trở lại tương lai

Một bản cập nhật mới cho đường ống dữ liệu cấp vào DataFrame ride_sharing đã được bổ sung để ghi nhận ngày của mỗi chuyến đi. Thông tin này được lưu trong cột ride_date có kiểu object, tức là chuỗi trong pandas.

Đã phát hiện một lỗi khiến các chuyến đi diễn ra hôm nay bị ghi nhận như diễn ra vào năm sau. Để khắc phục, bạn sẽ tìm tất cả các giá trị trong cột ride_date rơi vào bất kỳ thời điểm nào trong tương lai và đặt giá trị tối đa có thể của cột này về ngày hôm nay. Trước khi làm vậy, bạn cần chuyển ride_date sang đối tượng datetime.

Gói datetime đã được nhập với bí danh dt, cùng với tất cả các gói bạn đã dùng đến giờ.

Hướng dẫn

100 XP
  • Chuyển ride_date thành đối tượng datetime bằng to_datetime(), sau đó chuyển đối tượng datetime thành date và lưu vào cột ride_dt.
  • Tạo biến today, lưu ngày hôm nay bằng hàm dt.date.today().
  • Với tất cả các giá trị ride_dt ở tương lai, đặt chúng về ngày hôm nay.
  • In ra ngày lớn nhất trong cột ride_dt.