1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Ensemble Methods in Python

Connected

Bài tập

Khám phá dữ liệu UCI SECOM

Để khép lại chương này và củng cố hiểu biết của bạn về bagging, đã đến lúc làm việc với một bộ dữ liệu mới! Dữ liệu này đến từ quy trình sản xuất bán dẫn, lấy từ UCI Machine Learning Repository.

Mỗi hàng là một thực thể sản xuất. Các đặc trưng là các phép đo từ cảm biến hoặc các điểm trong quy trình. Nhãn cho biết thực thể vượt qua (1) hay trượt (-1) bài kiểm tra.

Bộ dữ liệu đã được nạp và sẵn sàng dưới tên uci_secom. Biến target là cột 'Pass/Fail'. Hãy dùng các phương thức .value_counts() và .describe() để kiểm tra biến này. Bạn nhận thấy điều gì?

Hướng dẫn

50 XP

Các phương án trả lời