Feature aritmetiche
Per esercitarti a creare nuove feature, lavorerai con un sottoinsieme della competizione Kaggle "House Prices: Advanced Regression Techniques". L'obiettivo della competizione è prevedere il prezzo di una casa a partire dalle sue caratteristiche. È un problema di regressione con Root Mean Squared Error come metrica di valutazione.
Il tuo obiettivo è creare nuove feature e verificare se migliorano il tuo punteggio di validazione. Per ottenere il punteggio di validazione con una cross-validation a 5 fold, hai a disposizione la funzione get_kfold_rmse(). Usala passandole il DataFrame train, disponibile nel tuo workspace, come argomento.
Questo esercizio fa parte del corso
Vincere una competizione Kaggle con Python
esercizio interattivo pratico
Prova questo esercizio completando questo codice di esempio.
# Look at the initial RMSE
print('RMSE before feature engineering:', get_kfold_rmse(train))
# Find the total area of the house
train['TotalArea'] = ____[____] + ____[____] + ____[____]
# Look at the updated RMSE
print('RMSE with total area:', get_kfold_rmse(train))