MulaiMulai sekarang secara gratis

Fitur aritmetika

Untuk berlatih membuat fitur baru, Anda akan bekerja dengan subsampel dari kompetisi Kaggle berjudul "House Prices: Advanced Regression Techniques". Tujuan kompetisi ini adalah memprediksi harga rumah berdasarkan karakteristiknya. Ini adalah masalah regresi dengan Root Mean Squared Error sebagai metrik evaluasi.

Tujuan Anda adalah membuat fitur-fitur baru dan menentukan apakah fitur tersebut meningkatkan skor validasi. Untuk mendapatkan skor validasi dari 5-fold cross-validation, Anda disediakan fungsi get_kfold_rmse(). Gunakan fungsi tersebut dengan DataFrame train, yang tersedia di workspace Anda, sebagai argumen.

Latihan ini adalah bagian dari kursus

Memenangi Kompetisi Kaggle dengan Python

Lihat Kursus

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Look at the initial RMSE
print('RMSE before feature engineering:', get_kfold_rmse(train))

# Find the total area of the house
train['TotalArea'] = ____[____] + ____[____] + ____[____]

# Look at the updated RMSE
print('RMSE with total area:', get_kfold_rmse(train))
Edit dan Jalankan Kode