Temel öğreniciler olarak karar ağaçları
Şimdi sıra bir XGBoost modeli kurup ev fiyatlarını tahmin etmeye geldi — videoda gördüğün gibi Massachusetts, Boston değil; Iowa, Ames için! Bu konut fiyatları veri kümesi df adlı bir DataFrame'e önceden yüklenmiş durumda. Shell'de incelersen, evin kendisi ve şehir içindeki konumuna dair çeşitli özellikler olduğunu göreceksin.
Bu egzersizde amacın ağaçları temel öğrenici olarak kullanmak. Varsayılan olarak XGBoost temel öğrenici olarak ağaçları kullanır, bu yüzden burada booster="gbtree" ile ağaç kullanmak istediğini belirtmene gerek yok.
xgboost xgb olarak içe aktarılmış durumda ve özellikler ile hedefe ait diziler sırasıyla X ve y içinde hazır.
Bu egzersiz
XGBoost ile Aşırı Gradyan Artırma
kursunun bir parçasıdırEgzersiz talimatları
df'i eğitim ve test kümelerine ayır; verinin %20'sini test için ayır.random_stateolarak123kullan.XGBRegressor'ıxg_regadıyla oluştur;seedolarak123kullan. Amacı"reg:squarederror"olarak belirt ve 10 ağaç kullan. Not: Varsayılan bu olduğu içinbooster="gbtree"belirtmene gerek yok.xg_reg'i eğitim verisine uydur ve test kümesinin etiketlerini tahmin et. Tahminleripredsadlı değişkende sakla.rmsedeğerini, önceden içe aktarılmışsklearn.metricsiçindekimean_squared_error()fonksiyonunu venp.sqrt()kullanarak hesapla.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Create the training and test sets
X_train, X_test, y_train, y_test = ____(____, ____, ____=____, random_state=123)
# Instantiate the XGBRegressor: xg_reg
xg_reg = ____
# Fit the regressor to the training set
____
# Predict the labels of the test set: preds
preds = ____
# Compute the rmse: rmse
rmse = ____(____(____, ____))
print("RMSE: %f" % (rmse))