Böbrek hastalığı vaka çalışması III: Tam boru hattı
Tüm dönüşümleri bir XGBClassifier ile bir araya getirip tam boru hattını kurma zamanı!
Önceki egzersizde oluşturduğun numeric_categorical_union dışında iki dönüşüm daha gerekli: senin için oluşturduğumuz Dictifier() dönüşümü ve DictVectorizer().
Boru hattını oluşturduktan sonra, ne kadar iyi performans gösterdiğini görmek için çapraz doğrulama yapacaksın.
Bu egzersiz
XGBoost ile Aşırı Gradyan Artırma
kursunun bir parçasıdırEgzersiz talimatları
numeric_categorical_union,Dictifier(), veDictVectorizer(sort=False)dönüşümlerini vemax_depth=3ilexgb.XGBClassifier()kestirimcisini kullanarak boru hattını oluştur. Dönüşümlerin adları"featureunion","dictifier","vectorizer"ve kestirimcinin adı"clf"olsun.pipelineüzerindecross_val_score()kullanarak 3 katlı çapraz doğrulama yap. Fonksiyona boru hattıpipeline, özelliklerkidney_data, sonuçlarydeğerlerini geçir. Ayrıcascoringdeğerini"roc_auc"vecvdeğerini3olarak ayarla.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Create full pipeline
pipeline = ____([
("____", ____),
("____", ____),
("____", ____),
("____", ____)
])
# Perform cross-validation
cross_val_scores = ____(____, ____, ____, ____="____", ____=____)
# Print avg. AUC
print("3-fold AUC: ", np.mean(cross_val_scores))