Validación cruzada de tu modelo de XGBoost
En este ejercicio, darás un paso más utilizando el pipeline que has creado para preprocesar y hacer la validación cruzada de tu modelo.
Este ejercicio forma parte del curso
Extreme Gradient Boosting con XGBoost
Instrucciones del ejercicio
- Crea un pipeline llamado
xgb_pipelineusandosteps. - Realiza una validación cruzada de 10 particiones con
cross_val_score(). Tendrás que pasar el pipeline,X(como diccionario, usando.to_dict("records")),y, el número de particiones que quieres usar yscoring("neg_mean_squared_error"). - Imprime el RMSE de 10 particiones.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Import necessary modules
from sklearn.feature_extraction import DictVectorizer
from sklearn.pipeline import Pipeline
from sklearn.model_selection import cross_val_score
# Fill LotFrontage missing values with 0
X.LotFrontage = ____
# Setup the pipeline steps: steps
steps = [("ohe_onestep", DictVectorizer(sparse=False)),
("xgb_model", xgb.XGBRegressor(max_depth=2, objective="reg:squarederror"))]
# Create the pipeline: xgb_pipeline
xgb_pipeline = ____
# Cross-validate the model
cross_val_scores = ____
# Print the 10-fold RMSE
print("10-fold RMSE: ", np.mean(np.sqrt(np.abs(____))))