Studi kasus penyakit ginjal III: Pipeline lengkap
Saatnya menyatukan semua transformasi bersama XGBClassifier untuk membangun pipeline lengkap!
Selain numeric_categorical_union yang Anda buat pada latihan sebelumnya, ada dua transformasi lain yang diperlukan: transformasi Dictifier() yang telah kami sediakan untuk Anda, dan DictVectorizer().
Setelah membuat pipeline, tugas Anda adalah melakukan validasi silang untuk melihat seberapa baik kinerjanya.
Latihan ini merupakan bagian dari kursus
Extreme Gradient Boosting dengan XGBoost
Instruksi latihan
- Buat pipeline menggunakan transformasi
numeric_categorical_union,Dictifier(), danDictVectorizer(sort=False), serta estimatorxgb.XGBClassifier()denganmax_depth=3. Beri nama transformasi"featureunion","dictifier","vectorizer", dan estimator"clf". - Lakukan validasi silang 3-fold pada
pipelinemenggunakancross_val_score(). Teruskan pipeline,pipeline, fitur,kidney_data, serta keluaran,y. Atur jugascoringmenjadi"roc_auc"dancvmenjadi3.
Latihan interaktif langsung praktik
Cobalah latihan ini dengan melengkapi kode contoh ini.
# Create full pipeline
pipeline = ____([
("____", ____),
("____", ____),
("____", ____),
("____", ____)
])
# Perform cross-validation
cross_val_scores = ____(____, ____, ____, ____="____", ____=____)
# Print avg. AUC
print("3-fold AUC: ", np.mean(cross_val_scores))