Caratteristiche a bassa varianza
Nel precedente esercizio hai stabilito che 0.001 è una buona soglia per filtrare le caratteristiche a bassa varianza in head_df dopo la normalizzazione. Ora usa il selettore di caratteristiche VarianceThreshold per rimuovere queste caratteristiche.
Questo esercizio fa parte del corso
Riduzione della dimensionalità in Python
Istruzioni dell'esercizio
- Crea il selettore con soglia di varianza pari a 0.001.
- Normalizza il DataFrame
head_dfdividendolo per i suoi valori medi e adatta il selettore. - Crea una maschera booleana dal selettore usando
.get_support(). - Crea un DataFrame ridotto passando la maschera al metodo
.loc[].
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
from sklearn.feature_selection import VarianceThreshold
# Create a VarianceThreshold feature selector
sel = ____(threshold=____)
# Fit the selector to normalized head_df
sel.fit(____ / ____)
# Create a boolean mask
mask = sel.____
# Apply the mask to create a reduced DataFrame
reduced_df = head_df.loc[____, ____]
print(f"Dimensionality reduced from {head_df.shape[1]} to {reduced_df.shape[1]}.")