1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Nhập môn Phân tích Dự đoán với Python

Connected

Bài tập

Các biến tương quan

10 biến đầu tiên được thêm vào mô hình như sau:

['max_gift', 'number_gift', 'time_since_last_gift', 'mean_gift', 'income_high', 'age', 'country_USA', 'gender_F', 'income_low', 'country_UK']

Như bạn thấy, min_gift không được thêm vào. Điều đó có nghĩa đây là một biến tệ sao? Bạn có thể kiểm tra hiệu quả của biến này bằng cách dùng nó làm biến đơn lẻ trong mô hình và tính AUC. AUC của min_gift so với AUC của income_high như thế nào? Để làm điều này, bạn có thể dùng hàm auc():

auc(variables, target, basetable)

Đôi khi một biến tốt không được thêm vào vì nó tương quan cao với một biến đã có trong mô hình. Bạn có thể kiểm tra điều này bằng cách tính tương quan giữa các biến đó:

import numpy
numpy.corrcoef(basetable["variable_1"],basetable["variable_2"])[0,1]

Hướng dẫn

100 XP
  • Tính AUC của mô hình khi chỉ dùng biến min_gift.
  • Tính AUC của mô hình khi chỉ dùng biến income_high.
  • Tính hệ số tương quan giữa biến min_gift và mean_gift.