1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Machine Learning cho Marketing với Python

Connected

Bài tập

Tách cột số và cột phân loại

Ở bài tập trước, bạn đã khám phá đặc điểm của bộ dữ liệu và sẵn sàng tiền xử lý dữ liệu. Bây giờ, bạn sẽ tách các biến phân loại và biến số khỏi DataFrame telco_raw với một ngưỡng số lượng giá trị duy nhất tùy chỉnh để phân biệt phân loại vs. số. Mô-đun pandas đã được import sẵn là pd.

Bộ dữ liệu churn viễn thông thô telco_raw đã được nạp sẵn dưới dạng DataFrame của pandas. Bạn có thể làm quen với bộ dữ liệu bằng cách khám phá nó trong console.

Hướng dẫn

100 XP
  • Lưu tên các cột customerID và Churn.
  • Gán cho categorical các tên cột có ít hơn 5 giá trị duy nhất.
  • Xóa target khỏi danh sách.
  • Gán cho numerical tất cả tên cột không thuộc custid, target và categorical.