1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Machine Learning với mô hình dựa trên cây trong Python

Connected

Bài tập

Huấn luyện cây phân loại đầu tiên của bạn

Trong bài tập này, bạn sẽ làm việc với Wisconsin Breast Cancer Dataset từ kho UCI machine learning. Bạn sẽ dự đoán liệu một khối u là ác tính hay lành tính dựa trên hai đặc trưng: bán kính trung bình của khối u (radius_mean) và số điểm lõm trung bình (concave points_mean).

Bộ dữ liệu đã được nạp sẵn vào không gian làm việc của bạn và được chia thành 80% huấn luyện và 20% kiểm tra. Ma trận đặc trưng được gán cho X_train và X_test, trong khi các mảng nhãn được gán cho y_train và y_test, trong đó lớp 1 tương ứng với khối u ác tính và lớp 0 tương ứng với khối u lành tính. Để có kết quả có thể tái lập, chúng tôi cũng đã định nghĩa một biến SEED với giá trị 1.

Hướng dẫn

100 XP
  • Import DecisionTreeClassifier từ sklearn.tree.

  • Khởi tạo một DecisionTreeClassifier dt với độ sâu tối đa bằng 6.

  • Fit dt vào tập huấn luyện.

  • Dự đoán nhãn của tập kiểm tra và gán kết quả cho y_pred.