1. Learn
  2. /
  3. Courses
  4. /
  5. R에서의 추론 기초

Connected

Exercise

무작위화 밀도

100번 반복하면 치환(permuting)의 작동 방식을 이해하는 데는 도움이 됩니다. 하지만 비율 차이의 영가설에서 가능한 값의 전체 범위를 관찰하기에는 100번이 충분하지 않습니다.

추론의 네 가지 단계를 떠올려 보세요. 이 네 단계는 이 강의와 이후의 통계적 추론 강의의 모든 추론 연습에서 동일하게 사용됩니다. 함수 이름이 분석 과정을 기억하는 데 도움이 될 거예요.

  • specify는 반응 변수와 설명 변수를 지정합니다.
  • hypothesize는 영가설을 선언합니다.
  • generate는 재표집, 순열, 또는 시뮬레이션을 생성합니다.
  • calculate는 요약 통계를 계산합니다.

이번 연습에서는 이 과정을 1000번 반복해 비율 차이의 영가설 분포 전체에 대한 감을 잡아 보겠습니다.

Instructions

100 XP

dplyr, ggplot2, NHANES, infer 패키지가 미리 로드되어 있습니다.

  • infer 문법을 사용해 HomeOwn 변수를 섞어(shuffle) 비율 차이를 1000개 생성하세요. infer 문법을 다시 한 번 정리하면 다음과 같습니다:
    • 관심 있는 관계를 HomeOwn 대 Gender로 specify하고, 이 맥락에서의 성공은 주택 소유이므로 success = "Own"으로 지정합니다.
    • hypothesize에서 null = "independence"(성별과 주택 소유가 관련이 없음을 의미)를 가정합니다.
    • generate에서 순열을 1000번 생성합니다. reps를 1000으로 설정합니다.
    • calculate에서 통계를 stat = "diff in props"로 계산하고, 순서는 c("male", "female")로 지정합니다.
  • 밀도 그래프 코드를 실행해 차이 분포의 매끄러운 시각화를 만드세요. 곡선의 모양은 어떠한가요?