Wichtige Features auswählen
In dieser Übung sollst du nur die wichtigsten Features auswählen, die vom finalen Modell verwendet werden. Denk daran: Die relativen Bedeutungen sind in der Spalte importance des DataFrames relative_importances gespeichert.
Diese Übung ist Teil des Kurses
HR Analytics: Mitarbeiterfluktuation mit Python vorhersagen
Anleitung zur Übung
- Wähle nur die Features mit einem
importance-Wert größer als 1 % aus. - Erstelle daraus eine Liste und gib sie aus (das ist bereits für dich erledigt).
- Verwende den Index in
selected_list, um sowohlfeatures_trainals auchfeatures_testso zu transformieren, dass nur die Features mit einer Bedeutung größer als 1 % enthalten sind.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# select only features with relative importance higher than 1%
selected_features = relative_importances[relative_importances.____>0.01]
# create a list from those features: done
selected_list = selected_features.index
# transform both features_train and features_test components to include only selected features
features_train_selected = features_train[selected_list]
features_test_selected = ____[____]