1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Tư duy Thống kê với Python (Phần 2)

Connected

Bài tập

Kiểm định giả thuyết với tương quan Pearson

Tương quan quan sát giữa mù chữ ở nữ và tỷ suất sinh có thể chỉ do ngẫu nhiên; tỷ suất sinh của một quốc gia thực ra có thể hoàn toàn độc lập với mức mù chữ. Bạn sẽ kiểm định giả thuyết này. Để làm vậy, hoán vị các giá trị mù chữ nhưng giữ nguyên các giá trị tỷ suất sinh. Cách này mô phỏng giả thuyết rằng chúng hoàn toàn độc lập với nhau. Với mỗi hoán vị, hãy tính hệ số tương quan Pearson và đánh giá xem có bao nhiêu bản sao hoán vị của bạn có hệ số tương quan Pearson lớn hơn giá trị quan sát được.

Hàm pearson_r() mà bạn đã viết trong phần tiền truyện của khóa học này để tính hệ số tương quan Pearson đã được cung cấp sẵn cho bạn.

Hướng dẫn

100 XP
  • Tính hệ số tương quan Pearson quan sát được giữa illiteracy và fertility.
  • Khởi tạo một mảng để lưu các bản sao hoán vị.
  • Viết vòng lặp for để rút 10.000 bản sao:
    • Hoán vị các giá trị illiteracy bằng np.random.permutation().
    • Tính tương quan Pearson giữa mảng mù chữ đã hoán vị, illiteracy_permuted, và fertility.
  • Tính và in ra p-value từ các bản sao.