CommencerCommencer gratuitement

Sélection des caractéristiques importantes

Dans cet exercice, votre tâche consiste à ne sélectionner que les caractéristiques les plus importantes qui seront utilisées par le modèle final. Rappelez-vous que les importances relatives sont enregistrées dans la colonne importance du DataFrame nommé relative_importances.

Cet exercice fait partie du cours

Analytique RH : prédire l’attrition des employés en Python

Afficher le cours

Instructions

  • Sélectionnez uniquement les caractéristiques dont la valeur importance est supérieure à 1 %.
  • Créez une liste à partir de ces caractéristiques et affichez-la (cela a été fait pour vous).
  • En utilisant l’index enregistré dans selected_list, transformez features_train et features_test pour n’inclure que les caractéristiques dont l’importance est supérieure à 1 %.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# select only features with relative importance higher than 1%
selected_features = relative_importances[relative_importances.____>0.01]

# create a list from those features: done
selected_list = selected_features.index

# transform both features_train and features_test components to include only selected features
features_train_selected = features_train[selected_list]
features_test_selected = ____[____]
Modifier et exécuter le code