1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Làm sạch dữ liệu với Python

Connected

Bài tập

Định dạng ngày thống nhất

Sau khi đã chuẩn hóa đơn vị tiền tệ cho các số dư tài khoản khác nhau, bạn muốn thêm khía cạnh thời gian vào phân tích để xem khách hàng đã đầu tư tiền như thế nào theo quy mô tài khoản qua từng năm. Cột account_opened cho biết thời điểm khách hàng mở tài khoản và là một đại diện tốt để phân khúc hoạt động và đầu tư của khách hàng theo thời gian.

Tuy nhiên, vì dữ liệu này được tổng hợp từ nhiều nguồn, bạn cần đảm bảo tất cả ngày tháng có cùng định dạng. Bạn sẽ làm điều đó bằng cách chuyển cột này thành đối tượng datetime, đồng thời để trình suy luận xác định định dạng và đặt các định dạng có thể không hợp lệ thành giá trị khuyết. DataFrame banking đã có trong môi trường của bạn và pandas đã được nhập là pd.

Hướng dẫn 1/4

undefined XP
    1
    2
    3
    4
  • In phần đầu của account_opened từ DataFrame banking và quan sát các kết quả khác nhau.