1. Învăţa
  2. /
  3. Courses
  4. /
  5. Làm việc với dữ liệu phân loại trong Python

Connected

exercise

Gộp hạng mục

Một vấn đề mà người dùng của một trang web nhận nuôi chó địa phương phản ánh là có quá nhiều lựa chọn. Khi lướt qua các giống chó khác nhau, họ bị rối vì số lượng tùy chọn quá lớn. Để đơn giản hóa dữ liệu, bạn sẽ xem từng cột và gộp dữ liệu khi phù hợp. Để bảo toàn dữ liệu gốc, bạn sẽ tạo các cột cập nhật mới trong dữ liệu dogs. Bạn sẽ bắt đầu với cột coat. Bảng tần suất như sau:

short          1969
medium          565
wirehaired      220
long            180
medium-long       3

Instrucţiuni

100 XP
  • Tạo một từ điển tên update_coats để ánh xạ cả wirehaired và medium-long về medium.
  • Gộp các hạng mục được liệt kê trong từ điển mới này và lưu thành một cột mới, coat_collapsed.
  • Chuyển cột mới này thành một Series kiểu phân loại (categorical).
  • In bảng tần suất của Series mới này.