1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Thiết kế quy trình Machine Learning bằng Python

Connected

Bài tập

Biến đổi đặc trưng

Bạn đang thảo luận về tập dữ liệu tín dụng với quản lý ngân hàng. Chị ấy gợi ý rằng các hồ sơ vay an toàn nhất thường yêu cầu khoản tín dụng ở mức trung bình. Các giá trị quá thấp hoặc quá cao đều gợi ý rủi ro cao. Điều này có nghĩa là có thể tồn tại một mối quan hệ phi tuyến giữa biến này và nhãn. Bạn muốn kiểm chứng giả thuyết này. Bạn sẽ tạo một phép biến đổi phi tuyến cho đặc trưng đó. Sau đó, bạn sẽ đánh giá đặc trưng nào trong hai đặc trưng dự đoán nhãn tốt hơn bằng cách dùng SelectKBest() và độ đo chi2(), cả hai đã được nạp sẵn.

Dữ liệu có trong một pandas DataFrame tên credit, với nhãn nằm trong cột class. Bạn cũng đã nạp sẵn pandas dưới tên pd và numpy dưới tên np.

Hướng dẫn

100 XP
  • Định nghĩa một hàm biến đổi một vector số bằng cách lấy độ lệch tuyệt đối của từng giá trị so với giá trị trung bình của vector.
  • Áp dụng phép biến đổi này cho cột credit_amount của tập dữ liệu và lưu vào cột mới tên diff.
  • Tạo bộ chọn đặc trưng SelectKBest() để chọn một trong hai cột, credit_amount và diff, sử dụng độ đo chi2().
  • Kiểm tra kết quả.