Feature aritmetiche
Per esercitarti a creare nuove feature, lavorerai con un sottoinsieme della competizione Kaggle "House Prices: Advanced Regression Techniques". L'obiettivo della competizione è prevedere il prezzo di una casa a partire dalle sue caratteristiche. È un problema di regressione con Root Mean Squared Error come metrica di valutazione.
Il tuo obiettivo è creare nuove feature e verificare se migliorano il tuo punteggio di validazione. Per ottenere il punteggio di validazione con una cross-validation a 5 fold, hai a disposizione la funzione get_kfold_rmse(). Usala passandole il DataFrame train, disponibile nel tuo workspace, come argomento.
Questo esercizio fa parte del corso
Vincere una competizione Kaggle con Python
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Look at the initial RMSE
print('RMSE before feature engineering:', get_kfold_rmse(train))
# Find the total area of the house
train['TotalArea'] = ____[____] + ____[____] + ____[____]
# Look at the updated RMSE
print('RMSE with total area:', get_kfold_rmse(train))