1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Mô phỏng Monte Carlo với Python

Connected

Bài tập

Mối quan hệ giữa ma trận tương quan và ma trận hiệp phương sai

Trước đó trong khóa học, bạn đã dùng .cov() để lấy ma trận hiệp phương sai và .corr() để lấy ma trận tương quan. Hai khái niệm này rất dễ bị nhầm lẫn và dẫn đến dùng sai trong mô phỏng. Hãy làm rõ nhé!

Ma trận tương quan là ma trận hiệp phương sai được chuẩn hóa, trong đó các hệ số tương quan trong ma trận tương quan có giá trị từ 0 đến 1.

\(cov(x,y) = corr(x,y) \times std(x) \times std(y)\)

Công thức trên cho biết \(cov(x,y)\), tức giá trị hiệp phương sai, có thể được tính bằng cách nhân hệ số tương quan \(corr(x,y)\) với độ lệch chuẩn của \(x\), \(std(x)\), và độ lệch chuẩn của \(y\), \(std(y)\). Bạn sẽ kiểm chứng mối quan hệ này trong bài tập này!

Bộ dữ liệu tiểu đường đã được nạp thành một DataFrame, dia, và cả pandas với bí danh pd cùng numpy với bí danh np đã được nhập sẵn cho bạn.

Hướng dẫn

100 XP
  • Tính ma trận hiệp phương sai của dia[["bmi", "tc"]], lưu thành cov_dia2.
  • Tính ma trận tương quan của dia[["bmi", "tc"]], lưu thành corr_dia2.