1. Learn
  2. /
  3. Courses
  4. /
  5. Làm sạch dữ liệu với Python

Connected

Exercise

Ánh xạ lại các hạng mục

Để hiểu rõ hơn về người trả lời khảo sát từ airlines, bạn muốn tìm xem có mối quan hệ nào giữa một số câu trả lời với ngày trong tuần và thời gian chờ tại cổng hay không.

DataFrame airlines chứa các cột day và wait_min, lần lượt là dữ liệu phân loại và số. Cột day cho biết chính xác ngày chuyến bay diễn ra, còn wait_min là số phút hành khách chờ tại cổng. Để việc phân tích dễ hơn, bạn muốn tạo hai biến phân loại mới:

  • wait_type: 'short' cho 0–60 phút, 'medium' cho 60–180 và long cho 180+
  • day_week: 'weekday' nếu là ngày trong tuần, 'weekend' nếu là cuối tuần.

Các gói pandas và numpy đã được import lần lượt là pd và np. Hãy tạo một số dữ liệu phân loại mới!

Instructions

100 XP
  • Tạo các khoảng và nhãn cho cột wait_type như mô tả.
  • Tạo cột wait_type từ wait_min bằng pd.cut(), truyền label_ranges và label_names vào đúng tham số.
  • Tạo dictionary mapping để ánh xạ các ngày trong tuần về 'weekday' và các ngày cuối tuần về 'weekend'.
  • Tạo cột day_week bằng .replace().