1. เรียนรู้
  2. /
  3. Courses
  4. /
  5. Python으로 하는 통계적 사고 (2부)

Connected

Exercises

유전 가능성 측정

피어슨 상관 계수는 공분산을 두 데이터 세트의 분산의 기하평균으로 나눈 비율이에요. 이는 부모와 자식 간 상관을 나타내지만, 유전 가능성의 최적 추정치는 아닐 수 있어요. 한 걸음 물러서 생각해 보면, 유전 가능성은 부모-자식 간 공분산을 ‘부모의 분산만’으로 나눈 비율로 정의하는 것이 더 타당해 보여요. 이 연습 문제에서는 유전 가능성을 추정하고, 페어 부트스트랩을 통해 95% 신뢰 구간을 구해 보세요.

이 연습 문제는 매우 중요한 점을 강조해요. 통계적 추론(그리고 일반적인 데이터 분석)은 기계적으로 공식을 대입하는 작업이 아니에요. 데이터로 답하고자 하는 질문이 무엇인지 신중히 생각하고, 그에 맞게 분석해야 해요. 형질의 유전성이 어느 정도인지가 관심사라면, 우리가 정의한 유전 가능성 지표가 기성 통계량인 피어슨 상관 계수보다 더 적합해요.

데이터는 bd_parent_scandens, bd_offspring_scandens, bd_parent_fortis, bd_offspring_fortis에 저장되어 있다는 점을 기억하세요.

คำแนะนำ

100 XP
  • 부모와 자식의 형질 공분산을 부모 형질의 분산으로 나눈 비율로 정의된 유전 가능성을 계산하는 함수 heritability(parents, offspring)를 작성하세요. 힌트: 이 강의 전편에서 다뤘던 np.cov() 함수를 떠올려 보세요.
  • 이 함수를 사용해 G. scandens와 G. fortis의 유전 가능성을 계산하세요.
  • G. scandens와 G. fortis에 대해 페어 부트스트랩을 사용해 유전 가능성의 부트스트랩 복제본 1000개를 얻으세요.
  • 부트스트랩 복제본으로 두 종 모두의 95% 신뢰 구간을 계산하세요.
  • 결과를 출력하세요.