CommencerCommencer gratuitement

Caractéristiques arithmétiques

Pour vous entraîner à créer de nouvelles features, vous allez travailler sur un sous-échantillon de la compétition Kaggle « House Prices: Advanced Regression Techniques ». L’objectif de cette compétition est de prédire le prix d’une maison à partir de ses caractéristiques. Il s’agit d’un problème de régression évalué avec la racine de l’erreur quadratique moyenne (Root Mean Squared Error).

Votre objectif est de créer de nouvelles features et de déterminer si elles améliorent votre score de validation. Pour obtenir le score de validation par validation croisée en 5 plis, on vous fournit la fonction get_kfold_rmse(). Utilisez-la avec le DataFrame train, disponible dans votre espace de travail, comme argument.

Cet exercice fait partie du cours

Gagner une compétition Kaggle en Python

Afficher le cours

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Look at the initial RMSE
print('RMSE before feature engineering:', get_kfold_rmse(train))

# Find the total area of the house
train['TotalArea'] = ____[____] + ____[____] + ____[____]

# Look at the updated RMSE
print('RMSE with total area:', get_kfold_rmse(train))
Modifier et exécuter le code