ComeçarComece de graça

Validação cruzada do seu modelo XGBoost

Neste exercício, você vai um passo além usando o pipeline que você criou para pré-processar e também fazer a validação cruzada do seu modelo.

Este exercício faz parte do curso

Extreme Gradient Boosting com XGBoost

Ver curso

Instruções do exercício

  • Crie um pipeline chamado xgb_pipeline usando steps.
  • Faça validação cruzada com 10 folds usando cross_val_score(). Você precisará passar o pipeline, X (como dicionário, usando .to_dict("records")), y, o número de folds que você quer usar e scoring ("neg_mean_squared_error").
  • Imprima o RMSE de 10 folds.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Import necessary modules
from sklearn.feature_extraction import DictVectorizer
from sklearn.pipeline import Pipeline
from sklearn.model_selection import cross_val_score

# Fill LotFrontage missing values with 0
X.LotFrontage = ____

# Setup the pipeline steps: steps
steps = [("ohe_onestep", DictVectorizer(sparse=False)),
         ("xgb_model", xgb.XGBRegressor(max_depth=2, objective="reg:squarederror"))]

# Create the pipeline: xgb_pipeline
xgb_pipeline = ____

# Cross-validate the model
cross_val_scores = ____

# Print the 10-fold RMSE
print("10-fold RMSE: ", np.mean(np.sqrt(np.abs(____))))
Editar e executar o código