1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Nhập dữ liệu nâng cao trong R

Connected

Bài tập

Ngoại đề: Tương quan

Nếu bạn quen thuộc với thống kê, hẳn bạn đã nghe về Tương quan Pearson. Đây là thước đo để đánh giá mức độ phụ thuộc tuyến tính giữa hai biến, giả sử \(X\) và \(Y\). Giá trị có thể nằm trong khoảng từ -1 đến 1; nếu gần 1 nghĩa là có mối liên hệ dương mạnh giữa các biến. Nếu \(X\) cao, thì \(Y\) cũng có xu hướng cao. Nếu gần -1, có mối liên hệ âm mạnh: \(X\) cao thì \(Y\) có xu hướng thấp. Khi tương quan Pearson giữa hai biến bằng 0, các biến này có thể độc lập: không có mối liên hệ giữa \(X\) và \(Y\).

Bạn có thể tính tương quan giữa hai vector bằng hàm cor(). Ví dụ đoạn mã sau tính tương quan giữa các cột height và width của data frame giả định size:

cor(size$height, size$width)

Bộ dữ liệu bạn đã làm việc ở bài trước, international.sav, vẫn có trong thư mục làm việc của bạn. Giờ bạn cần nhập dữ liệu và thực hiện phép tính đúng để trả lời câu hỏi sau:

Hệ số tương quan của hai biến số gdp và f_illit (tỷ lệ mù chữ nữ) là bao nhiêu?

Hướng dẫn

50 XP

Các phương án trả lời