1. 学ぶ
  2. /
  3. コース
  4. /
  5. Python으로 하는 통계 시뮬레이션

Connected

演習

비표준 추정량

이전 연습 문제에서는 간단한 부트스트랩을 실행했는데요, 이제 이를 더 복잡한 추정량에 맞게 수정해 보겠습니다.

여러분은 학생들의 건강 상태를 연구하고 있다고 가정해 볼게요. 1000명의 학생에 대한 키와 몸무게가 주어졌고, 키의 중앙값과 키-몸무게 상관관계, 그리고 각각에 대한 95% 신뢰구간에 관심이 있습니다. 부트스트래핑을 활용해 보겠습니다.

1000명의 학생 키와 몸무게가 담긴 pandas DataFrame df를 살펴보세요. 이를 사용해 키의 중앙값과 키-몸무게 간 상관계수 각각에 대한 95% 신뢰구간을 계산하세요.

指示

100 XP
  • df에서 .sample() 메서드를 사용해 복원추출로 표본을 생성하고, tmp_df에 할당하세요.
  • 생성된 각 데이터셋 tmp_df에서 .median()과 .corr()를 사용해 키의 중앙값과 키-몸무게 상관계수를 계산하세요.
  • 계산한 키 중앙값은 height_medians에, 상관계수는 hw_corr에 추가하세요.
  • 마지막으로 np.percentile()을 사용해 위 두 값 각각에 대한 95%([[2.5, 97.5]]) 신뢰구간을 계산하세요.