1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Python cho người dùng R

Connected

Bài tập

Biến giả (dummy variables)

Trong bài tập cuối cùng của khóa học, bạn sẽ chuẩn bị dữ liệu cho việc dựng mô hình bằng cách mã hóa giả (dummy) cho các cột không phải số. Ví dụ, nếu bạn có một cột giới tính với giá trị 'Male' và 'Female', bạn muốn tạo các cột riêng để cho biết quan sát đó thuộc 'Male' hay 'Female'. Quá trình tạo các biến giả này còn được gọi là one-hot encoding.

Bạn có thể dùng hàm get_dummies() của pandas để chuyển các cột không phải số thành các biến giả.

df_new = pd.get_dummies(df)

Chúng tôi đã lấy một phần của DataFrame flights để tạo flights_sub nhằm giúp bạn dễ quan sát hơn những gì đang diễn ra.

Hướng dẫn 1/3

undefined XP
    1
    2
    3

In 5 dòng đầu của flights_sub.