Selezionare le feature importanti
In questo esercizio, il tuo compito è selezionare solo le feature più importanti che verranno usate dal modello finale. Ricorda che le importanze relative sono salvate nella colonna importance del DataFrame chiamato relative_importances.
Questo esercizio fa parte del corso
HR Analytics: prevedere l'abbandono dei dipendenti in Python
Istruzioni dell'esercizio
- Seleziona solo le feature con un valore di
importancesuperiore all'1%. - Crea un elenco a partire da queste feature e stampalo (è già stato fatto per te).
- Usando l'indice salvato in
selected_list, trasforma siafeatures_trainsiafeatures_testper includere solo le feature con importanza superiore all'1%.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# select only features with relative importance higher than 1%
selected_features = relative_importances[relative_importances.____>0.01]
# create a list from those features: done
selected_list = selected_features.index
# transform both features_train and features_test components to include only selected features
features_train_selected = features_train[selected_list]
features_test_selected = ____[____]