1. 학습
  2. /
  3. 강의
  4. /
  5. Python으로 하는 통계적 사고 (2부)

Connected

연습 문제

자손과 부모 데이터의 상관관계

자손과 부모의 부리 깊이 간 상관관계를 정량화하기 위해 부모와 자손 사이의 피어슨 상관계수 같은 통계를 계산해 보겠습니다. 이에 대한 신뢰구간을 구하려면 페어 부트스트랩(pairs bootstrap)이 필요합니다.

여러분은 이미 선형 회귀에서 유도된 모수의 추정치를 얻기 위해 페어 부트스트랩을 수행하는 함수를 작성했습니다(참고: https://campus.datacamp.com/courses/statistical-thinking-in-python-part-2/bootstrap-confidence-intervals?ex=12). 이번 연습 문제에서는 draw_bs_pairs(x, y, func, size=1) 시그니처를 가진 새 함수를 만들어, 페어 부트스트랩을 수행하고 정의된 페어 샘플에서 단일 통계량을 계산하세요. 관심 있는 통계량은 func(bs_x, bs_y) 호출로 계산됩니다. 다음 연습 문제에서는 func로 pearson_r를 사용할 거예요.

지침

100 XP
  • 샘플링할 인덱스 배열을 준비하세요. (페어 부트스트랩에서는 인덱스를 무작위로 뽑아 그 인덱스로 쌍을 가져옵니다.)
  • 부트스트랩 복제본 배열을 초기화하세요. 길이가 size인 1차원 배열이어야 합니다.
  • 샘플을 그리기 위한 for 루프를 작성하세요.
  • 앞에서 준비한 인덱스 배열에서 무작위로 인덱스를 선택합니다.
  • 방금 선택한 인덱스를 사용해 입력 배열에서 x 값과 y 값을 추출하여 부트스트랩 샘플을 생성합니다.
  • func를 사용해 x와 y의 부트스트랩 샘플에서 관심 있는 통계량을 계산하고, 이를 부트스트랩 복제본 배열에 저장합니다.
  • 부트스트랩 복제본 배열을 반환하세요.