Sélection des caractéristiques importantes
Dans cet exercice, votre tâche consiste à ne sélectionner que les caractéristiques les plus importantes qui seront utilisées par le modèle final. Rappelez-vous que les importances relatives sont enregistrées dans la colonne importance du DataFrame nommé relative_importances.
Cet exercice fait partie du cours
Analytique RH : prédire l’attrition des employés en Python
Instructions
- Sélectionnez uniquement les caractéristiques dont la valeur
importanceest supérieure à 1 %. - Créez une liste à partir de ces caractéristiques et affichez-la (cela a été fait pour vous).
- En utilisant l’index enregistré dans
selected_list, transformezfeatures_trainetfeatures_testpour n’inclure que les caractéristiques dont l’importance est supérieure à 1 %.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# select only features with relative importance higher than 1%
selected_features = relative_importances[relative_importances.____>0.01]
# create a list from those features: done
selected_list = selected_features.index
# transform both features_train and features_test components to include only selected features
features_train_selected = features_train[selected_list]
features_test_selected = ____[____]