1. 学习
  2. /
  3. 课程
  4. /
  5. Học có giám sát trong R: Phân loại

Connected

练习

Xây dựng mô hình logistic regression đơn giản

Bộ dữ liệu donors chứa 93.462 ví dụ về những người được gửi thư kêu gọi gây quỹ cho các cựu quân nhân bị liệt. Cột donated có giá trị 1 nếu người đó đóng góp sau khi nhận được thư và 0 nếu không. Kết quả nhị phân này sẽ là biến phụ thuộc cho mô hình logistic regression.

Các cột còn lại là những đặc trưng của các nhà tài trợ tiềm năng có thể ảnh hưởng đến hành vi quyên góp. Đây là các biến độc lập của mô hình.

Khi xây dựng mô hình hồi quy, thường hữu ích nếu bạn hình thành giả thuyết về những biến độc lập nào sẽ dự đoán được biến phụ thuộc. Cột bad_address, nhận giá trị 1 nếu địa chỉ gửi thư không hợp lệ và 0 nếu hợp lệ, có vẻ sẽ làm giảm khả năng có đóng góp. Tương tự, bạn có thể nghi ngờ rằng mối quan tâm tôn giáo (interest_religion) và quan tâm đến vấn đề cựu chiến binh (interest_veterans) sẽ gắn với mức độ từ thiện cao hơn.

Trong bài tập này, bạn sẽ dùng ba yếu tố này để tạo một mô hình đơn giản về hành vi quyên góp. Bộ dữ liệu donors đã sẵn sàng để bạn sử dụng.

说明

100 XP
  • Khám phá donors bằng hàm str().
  • Đếm số lần xuất hiện của từng mức trong biến donated bằng hàm table().
  • Khớp một mô hình logistic regression bằng giao diện công thức với ba biến độc lập đã mô tả trước đó.
    • Gọi glm() với công thức là đối số đầu tiên và data frame là đối số data.
    • Lưu kết quả vào donation_model.
  • Tóm tắt đối tượng mô hình bằng summary().