Merkmale mit geringer Varianz
In der vorherigen Übung hast du festgestellt, dass 0,001 ein guter Schwellenwert ist, um Merkmale mit geringer Varianz in head_df nach der Normalisierung herauszufiltern. Verwende jetzt den Feature-Selektor VarianceThreshold, um diese Merkmale zu entfernen.
Diese Übung ist Teil des Kurses
<Kurs>Dimensionsreduktion in Python</Kurs>Übungsanweisungen
- Erstelle den Varianz-Schwellenwert-Selektor mit einem Schwellenwert von 0,001.
- Normalisiere das DataFrame
head_df, indem du es durch seine Mittelwerte teilst, und fitte den Selektor. - Erzeuge eine boolesche Maske aus dem Selektor mit
.get_support(). - Erzeuge ein reduziertes DataFrame, indem du die Maske an die Methode
.loc[]übergibst.
Interaktive praktische Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
from sklearn.feature_selection import VarianceThreshold
# Create a VarianceThreshold feature selector
sel = ____(threshold=____)
# Fit the selector to normalized head_df
sel.fit(____ / ____)
# Create a boolean mask
mask = sel.____
# Apply the mask to create a reduced DataFrame
reduced_df = head_df.loc[____, ____]
print(f"Dimensionality reduced from {head_df.shape[1]} to {reduced_df.shape[1]}.")