LoslegenKostenlos starten

Merkmale mit geringer Varianz

In der vorherigen Übung hast du festgestellt, dass 0,001 ein guter Schwellenwert ist, um Merkmale mit geringer Varianz in head_df nach der Normalisierung herauszufiltern. Verwende jetzt den Feature-Selektor VarianceThreshold, um diese Merkmale zu entfernen.

Diese Übung ist Teil des Kurses

<Kurs>Dimensionsreduktion in Python</Kurs>
Kurs ansehen

Übungsanweisungen

  • Erstelle den Varianz-Schwellenwert-Selektor mit einem Schwellenwert von 0,001.
  • Normalisiere das DataFrame head_df, indem du es durch seine Mittelwerte teilst, und fitte den Selektor.
  • Erzeuge eine boolesche Maske aus dem Selektor mit .get_support().
  • Erzeuge ein reduziertes DataFrame, indem du die Maske an die Methode .loc[] übergibst.

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

from sklearn.feature_selection import VarianceThreshold

# Create a VarianceThreshold feature selector
sel = ____(threshold=____)

# Fit the selector to normalized head_df
sel.fit(____ / ____)

# Create a boolean mask
mask = sel.____

# Apply the mask to create a reduced DataFrame
reduced_df = head_df.loc[____, ____]

print(f"Dimensionality reduced from {head_df.shape[1]} to {reduced_df.shape[1]}.")
Code bearbeiten und ausführen