1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Học có giám sát trong R: Phân loại

Connected

Bài tập

Mã hóa biến phân loại

Đôi khi một bộ dữ liệu có các giá trị số đại diện cho một biến phân loại.

Trong bộ dữ liệu donors, wealth_rating dùng số để chỉ mức độ giàu có của người quyên góp:

  • 0 = Không rõ
  • 1 = Thấp
  • 2 = Trung bình
  • 3 = Cao

Bài tập này minh họa cách chuẩn bị kiểu biến phân loại này và xem xét tác động của nó lên mô hình logistic regression. Data frame donors đã được cung cấp để bạn sử dụng.

Hướng dẫn

100 XP
  • Tạo một factor wealth_levels từ biến số wealth_rating với các nhãn như trên bằng cách truyền cho hàm factor() cột bạn muốn chuyển đổi, các level riêng lẻ và các nhãn.
  • Dùng relevel() để đổi hạng mục tham chiếu thành Medium. Đối số đầu tiên phải là cột factor mới của bạn.
  • Xây dựng một mô hình logistic regression dùng cột wealth_levels để dự đoán donated và hiển thị kết quả với summary().