무작위화 밀도

100번 반복하면 치환(permuting)의 작동 방식을 이해하는 데는 도움이 됩니다. 하지만 비율 차이의 영가설에서 가능한 값의 전체 범위를 관찰하기에는 100번이 충분하지 않습니다.

추론의 네 가지 단계를 떠올려 보세요. 이 네 단계는 이 강의와 이후의 통계적 추론 강의의 모든 추론 연습에서 동일하게 사용됩니다. 함수 이름이 분석 과정을 기억하는 데 도움이 될 거예요.

이번 연습에서는 이 과정을 1000번 반복해 비율 차이의 영가설 분포 전체에 대한 감을 잡아 보겠습니다.

dplyr, ggplot2, NHANES, infer 패키지가 미리 로드되어 있습니다.

infer 문법을 사용해 HomeOwn 변수를 섞어(shuffle) 비율 차이를 1000개 생성하세요. infer 문법을 다시 한 번 정리하면 다음과 같습니다:
- 관심 있는 관계를 HomeOwn 대 Gender로 specify하고, 이 맥락에서의 성공은 주택 소유이므로 success = "Own"으로 지정합니다.
- hypothesize에서 null = "independence"(성별과 주택 소유가 관련이 없음을 의미)를 가정합니다.
- generate에서 순열을 1000번 생성합니다. reps를 1000으로 설정합니다.
- calculate에서 통계를 stat = "diff in props"로 계산하고, 순서는 c("male", "female")로 지정합니다.
밀도 그래프 코드를 실행해 차이 분포의 매끄러운 시각화를 만드세요. 곡선의 모양은 어떠한가요?

연습 문제