Studi kasus penyakit ginjal III: Pipeline lengkap
Saatnya menyatukan semua transformasi bersama XGBClassifier untuk membangun pipeline lengkap!
Selain numeric_categorical_union yang Anda buat pada latihan sebelumnya, ada dua transformasi lain yang diperlukan: transformasi Dictifier() yang telah kami sediakan untuk Anda, dan DictVectorizer().
Setelah membuat pipeline, tugas Anda adalah melakukan validasi silang untuk melihat seberapa baik kinerjanya.
Latihan ini adalah bagian dari kursus
Extreme Gradient Boosting dengan XGBoost
Petunjuk latihan
- Buat pipeline menggunakan transformasi
numeric_categorical_union,Dictifier(), danDictVectorizer(sort=False), serta estimatorxgb.XGBClassifier()denganmax_depth=3. Beri nama transformasi"featureunion","dictifier","vectorizer", dan estimator"clf". - Lakukan validasi silang 3-fold pada
pipelinemenggunakancross_val_score(). Teruskan pipeline,pipeline, fitur,kidney_data, serta keluaran,y. Atur jugascoringmenjadi"roc_auc"dancvmenjadi3.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Create full pipeline
pipeline = ____([
("____", ____),
("____", ____),
("____", ____),
("____", ____)
])
# Perform cross-validation
cross_val_scores = ____(____, ____, ____, ____="____", ____=____)
# Print avg. AUC
print("3-fold AUC: ", np.mean(cross_val_scores))