1. 학습
  2. /
  3. 강의
  4. /
  5. R에서의 표본추출

Connected

연습 문제

체계적 표본추출, 괜찮을까요?

체계적 표본추출에는 한 가지 문제가 있어요. 데이터가 정렬되어 있거나, 행 순서에 어떤 패턴이나 의미가 있으면, 추출된 표본이 모집단을 대표하지 못할 수 있습니다. 이 문제는 행을 섞어서(shuffle) 해결할 수 있지만, 그렇게 되면 체계적 표본추출은 단순 무작위 표본추출과 사실상 동일해집니다.

이번 과제에서는 문제가 있는지 아닌지를 판단하는 방법을 살펴보겠습니다.

attrition_sys_samp이 제공되며 행 ID 열이 추가되어 있습니다. dplyr과 ggplot2는 로드되어 있어요.

지침 1/3

undefined XP
    1
    2
    3
  • attrition_pop에 행 ID 열을 추가하세요.
  • attrition_pop_id 데이터셋을 사용해 산점도를 그리고, rowid 대비 YearsAtCompany를 표시하고 부드러운 추세선을 추가하세요.