Rekenkundige features
Om nieuwe features te oefenen, werk je met een subset van de Kaggle-competitie "House Prices: Advanced Regression Techniques". Het doel van deze competitie is om de prijs van een huis te voorspellen op basis van de kenmerken. Het is een regressieprobleem met Root Mean Squared Error als evaluatiemetriek.
Jouw doel is om nieuwe features te maken en te bepalen of ze je validatiescore verbeteren. Om de validatiescore uit 5-fold cross-validation te krijgen, krijg je de functie get_kfold_rmse(). Gebruik die met de DataFrame train, beschikbaar in je werkruimte, als argument.
Deze oefening maakt deel uit van de cursus
Een Kaggle-competitie winnen met Python
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Look at the initial RMSE
print('RMSE before feature engineering:', get_kfold_rmse(train))
# Find the total area of the house
train['TotalArea'] = ____[____] + ____[____] + ____[____]
# Look at the updated RMSE
print('RMSE with total area:', get_kfold_rmse(train))