LoslegenKostenlos loslegen

Merkmale mit geringer Varianz

In der vorherigen Übung hast du festgestellt, dass 0,001 ein guter Schwellenwert ist, um Merkmale mit geringer Varianz in head_df nach der Normalisierung herauszufiltern. Verwende jetzt den Feature-Selektor VarianceThreshold, um diese Merkmale zu entfernen.

Diese Übung ist Teil des Kurses

Dimensionsreduktion in Python

Kurs anzeigen

Anleitung zur Übung

  • Erstelle den Varianz-Schwellenwert-Selektor mit einem Schwellenwert von 0,001.
  • Normalisiere das DataFrame head_df, indem du es durch seine Mittelwerte teilst, und fitte den Selektor.
  • Erzeuge eine boolesche Maske aus dem Selektor mit .get_support().
  • Erzeuge ein reduziertes DataFrame, indem du die Maske an die Methode .loc[] übergibst.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

from sklearn.feature_selection import VarianceThreshold

# Create a VarianceThreshold feature selector
sel = ____(threshold=____)

# Fit the selector to normalized head_df
sel.fit(____ / ____)

# Create a boolean mask
mask = sel.____

# Apply the mask to create a reduced DataFrame
reduced_df = head_df.loc[____, ____]

print(f"Dimensionality reduced from {head_df.shape[1]} to {reduced_df.shape[1]}.")
Code bearbeiten und ausführen