IniziaInizia gratis

Selezionare le feature importanti

In questo esercizio, il tuo compito è selezionare solo le feature più importanti che verranno usate dal modello finale. Ricorda che le importanze relative sono salvate nella colonna importance del DataFrame chiamato relative_importances.

Questo esercizio fa parte del corso

HR Analytics: prevedere l'abbandono dei dipendenti in Python

Visualizza il corso

Istruzioni dell'esercizio

  • Seleziona solo le feature con un valore di importance superiore all'1%.
  • Crea un elenco a partire da queste feature e stampalo (è già stato fatto per te).
  • Usando l'indice salvato in selected_list, trasforma sia features_train sia features_test per includere solo le feature con importanza superiore all'1%.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# select only features with relative importance higher than 1%
selected_features = relative_importances[relative_importances.____>0.01]

# create a list from those features: done
selected_list = selected_features.index

# transform both features_train and features_test components to include only selected features
features_train_selected = features_train[selected_list]
features_test_selected = ____[____]
Modifica ed esegui il codice