1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Học có giám sát với scikit-learn

Connected

Bài tập

Tạo biến giả (dummy variables)

Khả năng đưa các đặc trưng phân loại vào quá trình xây dựng mô hình có thể cải thiện hiệu năng vì chúng có thể bổ sung thông tin giúp tăng độ chính xác dự đoán.

Bộ dữ liệu music_df đã được nạp sẵn cho bạn và kích thước của nó đã được in ra. Ngoài ra, pandas đã được import với bí danh pd.

Giờ bạn sẽ tạo một DataFrame mới chứa các cột gốc của music_df cùng với các biến giả từ cột "genre".

Hướng dẫn

100 XP
  • Dùng hàm phù hợp, truyền toàn bộ DataFrame music_df, để tạo music_dummies, đồng thời bỏ cột nhị phân đầu tiên.
  • In kích thước (shape) của music_dummies.