BaşlayınÜcretsiz Başlayın

XGBoost: Fit/Predict

İlk XGBoost modelini oluşturma zamanı! Sergey’in videoda gösterdiği gibi, xgboost kütüphanesi scikit-learn ile uyumlu bir API’ye sahip olduğu için, hali hazırda bildiğin scikit-learn .fit() / .predict() yaklaşımını XGBoost modellerini kurarken kullanabilirsin.

Burada churn (müşteri kaybı) verileriyle çalışacaksın. Bu veri kümesi, hayali şehirlerde, bir yolculuk paylaşım uygulamasının kullanıcılarının uygulamayı ilk ay kullanımındaki davranışlarını ve kayıt olduktan 5 ay sonra hizmeti kullanıp kullanmadıklarını içeren hayali verilerden oluşuyor. Senin için churn_data adlı bir DataFrame’e önceden yüklenmiş durumda — Shell’de keşfet!

Amacın, ilk aydaki verileri kullanarak kullanıcıların 5. ayda hâlâ hizmeti kullanıp kullanmayacağını tahmin etmek. Bu, tipik bir churn tahmini problemidir. Bunu yapmak için veriyi eğitim ve test kümelerine bölecek, eğitim kümesi üzerinde küçük bir xgboost modeli eğitecek ve test kümesi üzerinde doğruluğunu hesaplayarak performansını değerlendireceksin.

pandas ve numpy sırasıyla pd ve np olarak içe aktarılmış durumda ve train_test_split de sklearn.model_selection içinden içe aktarılmıştır. Ayrıca, özellikler ve hedef için diziler X ve y olarak oluşturulmuştur.

Bu egzersiz

XGBoost ile Aşırı Gradyan Artırma

kursunun bir parçasıdır
Kursu Görüntüle

Egzersiz talimatları

  • xgboost kütüphanesini xgb olarak içe aktar.
  • Veriyi öyle bir şekilde eğitim ve test kümelerine ayır ki verinin %20’si test için kullanılsın. random_state olarak 123 kullan.
  • xgb.XGBClassifier() ile bir XGBoostClassifier örneğini xg_cl olarak başlat. n_estimators değerini 10 ağaç olarak ve objective değerini 'binary:logistic' olarak belirt. Bu ifadelerin ne anlama geldiğini şimdilik dert etme, bu parametreleri kursun ilerleyen kısmında öğreneceksin.
  • .fit() metodunu kullanarak xg_cl’i eğitim kümesine (X_train, y_train) uydur.
  • .predict() metodunu kullanarak test kümesinin (X_test) etiketlerini tahmin et ve doğruluğu yazdırmak için 'Yanıtı Gönder'e bas.

Uygulamalı interaktif egzersiz

Bu örnek kodu tamamlayarak bu egzersizi bitirin.

# Import xgboost
____

# Create arrays for the features and the target: X, y
X, y = churn_data.iloc[:,:-1], churn_data.iloc[:,-1]

# Create the training and test sets
X_train, X_test, y_train, y_test= ____(____, ____, test_size=____, random_state=123)

# Instantiate the XGBClassifier: xg_cl
xg_cl = ____.____(____='____', ____=____, seed=123)

# Fit the classifier to the training set
____

# Predict the labels of the test set: preds
preds = ____

# Compute the accuracy: accuracy
accuracy = float(np.sum(preds==y_test))/y_test.shape[0]
print("accuracy: %f" % (accuracy))
Kodu Düzenle ve Çalıştır