1. Learn
  2. /
  3. Courses
  4. /
  5. Machine Learning trong tidyverse

Connected

Exercise

Xây dựng mô hình phân loại cuối cùng

Khi so sánh hiệu năng recall giữa mô hình logistic regression (0.4) và mô hình random forest có hiệu năng tốt nhất (0.2), bạn thấy mô hình có hiệu năng tốt nhất là logistic regression. Trong bài tập này, bạn sẽ xây dựng mô hình logistic regression dùng toàn bộ dữ liệu train và chuẩn bị các vector cần thiết để đánh giá hiệu năng test của mô hình này.

Instructions

100 XP
  • Xây dựng một mô hình logistic regression dự đoán Attrition sử dụng toàn bộ đặc trưng có trong training_data.
  • Chuẩn bị vector nhị phân của giá trị thực tế trên test, test_actual.
  • Chuẩn bị vector nhị phân của giá trị dự đoán, trong đó xác suất lớn hơn 0.5 được coi là TRUE, và lưu vào test_predicted.