Características aritméticas
Para practicar la creación de nuevas características, trabajarás con una submuestra de la competición de Kaggle llamada "House Prices: Advanced Regression Techniques". El objetivo de esta competición es predecir el precio de una vivienda a partir de sus propiedades. Es un problema de regresión con Root Mean Squared Error como métrica de evaluación.
Tu objetivo es crear nuevas características y comprobar si mejoran tu puntuación de validación. Para obtener la puntuación de validación con validación cruzada de 5 pliegues, dispones de la función get_kfold_rmse(). Úsala con el DataFrame train, disponible en tu espacio de trabajo, como argumento.
Este ejercicio forma parte del curso
Cómo ganar una competición de Kaggle con Python
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Look at the initial RMSE
print('RMSE before feature engineering:', get_kfold_rmse(train))
# Find the total area of the house
train['TotalArea'] = ____[____] + ____[____] + ____[____]
# Look at the updated RMSE
print('RMSE with total area:', get_kfold_rmse(train))