1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Gradient Boosting Cực Mạnh với XGBoost

Connected

Bài tập

Nghiên cứu tình huống bệnh thận III: Pipeline đầy đủ

Đến lúc ghép tất cả các transform cùng với XGBClassifier để xây dựng pipeline đầy đủ!

Ngoài numeric_categorical_union mà bạn đã tạo ở bài trước, còn cần hai transform khác: Dictifier() (chúng tôi đã tạo sẵn cho bạn) và DictVectorizer().

Sau khi tạo pipeline, nhiệm vụ của bạn là thực hiện cross-validation để xem mô hình hoạt động tốt đến đâu.

Hướng dẫn

100 XP
  • Tạo pipeline với các transform numeric_categorical_union, Dictifier(), và DictVectorizer(sort=False), cùng estimator xgb.XGBClassifier() với max_depth=3. Đặt tên các transform lần lượt là "featureunion", "dictifier", "vectorizer", và estimator là "clf".
  • Thực hiện cross-validation 3-fold trên pipeline bằng cross_val_score(). Truyền vào pipeline, pipeline, dữ liệu đặc trưng, kidney_data, biến đầu ra, y. Đồng thời đặt scoring là "roc_auc" và cv là 3.