1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Xử lý dữ liệu với pandas

Connected

Bài tập

Loại bỏ bản ghi trùng lặp

Loại bỏ trùng lặp là kỹ năng cần thiết để đếm chính xác vì thường bạn không muốn tính cùng một đối tượng nhiều lần. Trong bài tập này, bạn sẽ tạo một vài DataFrame mới từ các giá trị duy nhất trong sales.

sales đã có sẵn và pandas đã được nhập với bí danh pd.

Hướng dẫn

100 XP
  • Xóa các hàng trong sales có cặp store và type trùng lặp, lưu thành store_types và in phần đầu (head).
  • Xóa các hàng trong sales có cặp store và department trùng lặp, lưu thành store_depts và in phần đầu (head).
  • Lọc các hàng là tuần nghỉ lễ bằng cột is_holiday, rồi loại các date trùng lặp, lưu thành holiday_dates.
  • Chọn cột date của holiday_dates, và in ra.