1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Tư duy Thống kê với Python (Phần 1)

Connected

Bài tập

Tính hệ số tương quan Pearson

Như đã đề cập trong video, hệ số tương quan Pearson (còn gọi là Pearson r) thường dễ diễn giải hơn hiệp phương sai. Nó được tính bằng hàm np.corrcoef(). Tương tự np.cov(), hàm này nhận hai mảng làm đối số và trả về một mảng 2D. Các phần tử [0,0] và [1,1] chắc chắn bằng 1 (bạn có đoán được vì sao không?), và giá trị chúng ta cần là phần tử [0,1].

Trong bài này, bạn sẽ viết một hàm pearson_r(x, y) nhận vào hai mảng và trả về hệ số tương quan Pearson. Sau đó, bạn sẽ dùng hàm này để tính hệ số cho chiều dài và chiều rộng cánh hoa của I. versicolor.

Chúng tôi cũng đính kèm lại biểu đồ phân tán bạn đã tạo ở bài trước để gợi nhớ mối quan hệ giữa chiều rộng và chiều dài cánh hoa.

Hướng dẫn

100 XP
  • Định nghĩa một hàm với chữ ký pearson_r(x, y).
    • Dùng np.corrcoef() để tính ma trận tương quan của x và y (truyền chúng vào np.corrcoef() theo đúng thứ tự đó).
    • Hàm trả về phần tử [0,1] của ma trận tương quan.
  • Tính hệ số tương quan Pearson giữa dữ liệu trong các mảng versicolor_petal_length và versicolor_petal_width. Gán kết quả cho r.
  • In kết quả.