1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Tư duy Thống kê với Python (Phần 2)

Connected

Bài tập

Đo lường hệ số di truyền

Hãy nhớ rằng hệ số tương quan Pearson là tỷ số giữa hiệp phương sai và trung bình nhân của các phương sai của hai tập dữ liệu. Đây là thước đo mối tương quan giữa bố mẹ và con cái, nhưng có thể không phải là ước lượng tốt nhất cho hệ số di truyền. Nếu dừng lại suy nghĩ, hợp lý hơn là định nghĩa hệ số di truyền là tỷ số giữa hiệp phương sai giữa bố mẹ và con cái với phương sai của riêng bố mẹ. Trong bài này, bạn sẽ ước lượng hệ số di truyền và thực hiện bootstrap theo cặp để lấy khoảng tin cậy 95%.

Bài tập này nhấn mạnh một điểm rất quan trọng. Suy luận thống kê (và phân tích dữ liệu nói chung) không phải là việc “cắm công thức rồi bấm”. Bạn cần suy nghĩ kỹ về các câu hỏi bạn muốn trả lời bằng dữ liệu và phân tích chúng cho phù hợp. Nếu bạn quan tâm đến mức độ di truyền của các đặc điểm, đại lượng mà chúng ta định nghĩa là hệ số di truyền phù hợp hơn so với thống kê có sẵn là hệ số tương quan Pearson.

Nhớ rằng dữ liệu được lưu trong bd_parent_scandens, bd_offspring_scandens, bd_parent_fortis và bd_offspring_fortis.

Hướng dẫn

100 XP
  • Viết hàm heritability(parents, offspring) để tính hệ số di truyền, được định nghĩa là tỷ số giữa hiệp phương sai của đặc điểm ở bố mẹ và con cái chia cho phương sai của đặc điểm ở bố mẹ. Gợi ý: Nhắc lại hàm np.cov() mà chúng ta đã học ở phần trước của khóa học.
  • Dùng hàm này để tính hệ số di truyền cho G. scandens và G. fortis.
  • Lấy 1000 bản lặp bootstrap của hệ số di truyền bằng pairs bootstrap cho G. scandens và G. fortis.
  • Tính khoảng tin cậy 95% cho cả hai bằng các bản lặp bootstrap của bạn.
  • In kết quả.