Recursos aritméticos
Para praticar a criação de novos recursos, você vai trabalhar com uma amostra da competição do Kaggle chamada "House Prices: Advanced Regression Techniques". O objetivo dessa competição é prever o preço de uma casa com base em suas propriedades. É um problema de regressão com Root Mean Squared Error como métrica de avaliação.
Seu objetivo é criar novos recursos e verificar se eles melhoram sua pontuação de validação. Para obter a pontuação de validação com validação cruzada em 5 folds, você tem a função get_kfold_rmse(). Use-a com o DataFrame train, disponível no seu ambiente de trabalho, como argumento.
Este exercício faz parte do curso
Vencendo uma competição do Kaggle em Python
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Look at the initial RMSE
print('RMSE before feature engineering:', get_kfold_rmse(train))
# Find the total area of the house
train['TotalArea'] = ____[____] + ____[____] + ____[____]
# Look at the updated RMSE
print('RMSE with total area:', get_kfold_rmse(train))