Fitur aritmetika
Untuk berlatih membuat fitur baru, Anda akan bekerja dengan subsampel dari kompetisi Kaggle berjudul "House Prices: Advanced Regression Techniques". Tujuan kompetisi ini adalah memprediksi harga rumah berdasarkan karakteristiknya. Ini adalah masalah regresi dengan Root Mean Squared Error sebagai metrik evaluasi.
Tujuan Anda adalah membuat fitur-fitur baru dan menentukan apakah fitur tersebut meningkatkan skor validasi. Untuk mendapatkan skor validasi dari 5-fold cross-validation, Anda disediakan fungsi get_kfold_rmse(). Gunakan fungsi tersebut dengan DataFrame train, yang tersedia di workspace Anda, sebagai argumen.
Latihan ini adalah bagian dari kursus
Memenangi Kompetisi Kaggle dengan Python
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Look at the initial RMSE
print('RMSE before feature engineering:', get_kfold_rmse(train))
# Find the total area of the house
train['TotalArea'] = ____[____] + ____[____] + ____[____]
# Look at the updated RMSE
print('RMSE with total area:', get_kfold_rmse(train))