LoslegenKostenlos loslegen

Wichtige Features auswählen

In dieser Übung sollst du nur die wichtigsten Features auswählen, die vom finalen Modell verwendet werden. Denk daran: Die relativen Bedeutungen sind in der Spalte importance des DataFrames relative_importances gespeichert.

Diese Übung ist Teil des Kurses

HR Analytics: Mitarbeiterfluktuation mit Python vorhersagen

Kurs anzeigen

Anleitung zur Übung

  • Wähle nur die Features mit einem importance-Wert größer als 1 % aus.
  • Erstelle daraus eine Liste und gib sie aus (das ist bereits für dich erledigt).
  • Verwende den Index in selected_list, um sowohl features_train als auch features_test so zu transformieren, dass nur die Features mit einer Bedeutung größer als 1 % enthalten sind.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# select only features with relative importance higher than 1%
selected_features = relative_importances[relative_importances.____>0.01]

# create a list from those features: done
selected_list = selected_features.index

# transform both features_train and features_test components to include only selected features
features_train_selected = features_train[selected_list]
features_test_selected = ____[____]
Code bearbeiten und ausführen