1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Luyện tập câu hỏi phỏng vấn Thống kê với R

Connected

Bài tập

Ước lượng mô hình logistic

Nhiều bài toán kinh doanh cần dự đoán một biến phản hồi nhị phân. Nhà tuyển dụng tương lai của bạn có thể cần phát hiện email spam, gian lận thẻ tín dụng, hoặc các bệnh hiếm.

Logistic regression model là phương pháp tiêu chuẩn cho các bài toán phân loại nhị phân.

Trong bài tập này, bạn sẽ sử dụng bộ dữ liệu Parkinson từ kho UCI. Bộ dữ liệu này bao gồm nhiều phép đo giọng nói y sinh học từ người có và không mắc bệnh Parkinson.

Bạn sẽ dùng các biến sau từ bộ dữ liệu:

  • status - 1 - nếu một người mắc bệnh Parkinson, 0 - nếu không,
  • NHR - thước đo tỷ lệ thành phần nhiễu so với thành phần âm sắc trong giọng nói,
  • DFA - số mũ tỉ lệ fractal của tín hiệu.

Bộ dữ liệu có sẵn dưới tên parkinsons.

Hướng dẫn 1/2

undefined XP
    1
    2
  • Vẽ biểu đồ phân tán của status theo NHR từ bộ dữ liệu parkinsons.
  • Vẽ biểu đồ phân tán của status theo DFA từ bộ dữ liệu parkinsons.