1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Luyện tập câu hỏi phỏng vấn Thống kê với R

Connected

Bài tập

Đánh giá mô hình phân loại

Trong bài học trước, bạn đã xây dựng một mô hình logistic để dự đoán bệnh Parkinson. Trong bài tập này, bạn sẽ so sánh dự đoán với giá trị thực tế.

Kỹ năng này rất quan trọng vì các công ty quan tâm đến kết quả. Nhà tuyển dụng muốn biết các mô hình bạn phát triển chính xác đến mức nào.

Một lần nữa, bạn sẽ xây dựng mô hình để dự đoán tình trạng bệnh Parkinson. Lần này, bạn sẽ xây dựng mô hình trên một phần dữ liệu và dùng phần còn lại để kiểm tra.

Hãy nhớ rằng \(\text{recall} = \frac{TP}{TP+FN}\).

\(TP\) nghĩa là bạn dự đoán dương tính và đúng.

\(FN\) nghĩa là bạn dự đoán âm tính nhưng sai.

Khoảng 80% số dòng của bộ dữ liệu parkinsons đã được gán vào train, và phần còn lại được gán vào test.

Hướng dẫn 1/3

undefined XP
    1
    2
    3
  • Xây dựng một mô hình logistic giải thích status theo NHR và DFA bằng dữ liệu train.
  • Tính xác suất mắc bệnh Parkinson cho dữ liệu test.