1. Învăţa
  2. /
  3. Courses
  4. /
  5. R로 연습하는 통계 면접 질문

Connected

exercise

로지스틱 모델 적합하기

많은 비즈니스 문제에서는 이진 반응 변수를 예측해야 합니다. 앞으로의 직장에서 스팸 이메일, 신용카드 사기, 혹은 희귀 질환을 탐지해야 할 수도 있어요.

이런 이진 분류 문제에서 logistic regression model은 가장 널리 쓰이는 방법입니다.

이번 연습 문제에서는 UCI 저장소의 파킨슨병 데이터를 사용합니다. 이 데이터셋은 파킨슨병이 있는 사람과 없는 사람의 다양한 생의학적 음성 측정값으로 구성되어 있습니다.

다음 변수를 사용할 거예요:

  • status - 파킨슨병이 있으면 1, 아니면 0,
  • NHR - 음성에서 소음 대비 배음(톤) 성분의 비율을 나타내는 측도,
  • DFA - 신호의 프랙탈 스케일링 지수.

데이터셋은 parkinsons로 제공됩니다.

Instrucțiuni 1 / 2

undefined XP
    1
    2
  • parkinsons 데이터셋에서 status를 NHR에 대해 산점도로 그리세요.
  • parkinsons 데이터셋에서 status를 DFA에 대해 산점도로 그리세요.