1. เรียนรู้
  2. /
  3. Courses
  4. /
  5. Nhập môn Mô hình tuyến tính với Python

Connected

Exercises

Độ mạnh tương quan

Về trực giác, bạn có thể nhìn các biểu đồ và “nhận ra” liệu hai biến có “thay đổi cùng nhau” hay không.

  • Bộ dữ liệu A: x và y thay đổi cùng nhau và có vẻ có mối quan hệ mạnh.
  • Bộ dữ liệu B: có xu hướng tăng nhẹ; x và y có vẻ chỉ liên hệ lỏng lẻo.
  • Bộ dữ liệu C: trông như nhiễu ngẫu nhiên; x và y không có vẻ thay đổi cùng nhau và không liên quan.

Data Set A

Data Set B

Data Set C

Hãy nhớ rằng độ lệch là chênh lệch so với giá trị trung bình, và ta chuẩn hóa bằng cách chia độ lệch cho độ lệch chuẩn. Trong bài này bạn sẽ so sánh 3 bộ dữ liệu bằng cách tính hệ số tương quan và xác định bộ dữ liệu nào có cặp biến x và y tương quan mạnh nhất. Sử dụng bảng dữ liệu data_sets, một danh sách các bản ghi (dictionary), mỗi bản ghi có các khóa 'name', 'x', 'y', và 'correlation'.

คำแนะนำ

100 XP
  • Hoàn thiện định nghĩa hàm correlation() bằng cách lấy trung bình của tích các độ lệch đã chuẩn hóa của x và y.
  • Lặp qua data_sets, tính và lưu từng giá trị tương quan bằng correlation(record['x'], record['y']).
  • Chạy mã đến thời điểm này (tức là kết thúc vòng lặp for) và xem kết quả in ra. Bộ dữ liệu nào có tương quan mạnh nhất?
  • Gán tên của bộ dữ liệu (data_sets['A'], data_sets['B'], hoặc data_sets['C']) có tương quan mạnh nhất vào biến best_data.