MulaiMulai sekarang secara gratis

Studi kasus penyakit ginjal III: Pipeline lengkap

Saatnya menyatukan semua transformasi bersama XGBClassifier untuk membangun pipeline lengkap!

Selain numeric_categorical_union yang Anda buat pada latihan sebelumnya, ada dua transformasi lain yang diperlukan: transformasi Dictifier() yang telah kami sediakan untuk Anda, dan DictVectorizer().

Setelah membuat pipeline, tugas Anda adalah melakukan validasi silang untuk melihat seberapa baik kinerjanya.

Latihan ini adalah bagian dari kursus

Extreme Gradient Boosting dengan XGBoost

Lihat Kursus

Petunjuk latihan

  • Buat pipeline menggunakan transformasi numeric_categorical_union, Dictifier(), dan DictVectorizer(sort=False), serta estimator xgb.XGBClassifier() dengan max_depth=3. Beri nama transformasi "featureunion", "dictifier", "vectorizer", dan estimator "clf".
  • Lakukan validasi silang 3-fold pada pipeline menggunakan cross_val_score(). Teruskan pipeline, pipeline, fitur, kidney_data, serta keluaran, y. Atur juga scoring menjadi "roc_auc" dan cv menjadi 3.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Create full pipeline
pipeline = ____([
                     ("____", ____),
                     ("____", ____),
                     ("____", ____),
                     ("____", ____)
                    ])

# Perform cross-validation
cross_val_scores = ____(____, ____, ____, ____="____", ____=____)

# Print avg. AUC
print("3-fold AUC: ", np.mean(cross_val_scores))
Edit dan Jalankan Kode