Inizia subitoInizia gratis

Caratteristiche a bassa varianza

Nel precedente esercizio hai stabilito che 0.001 è una buona soglia per filtrare le caratteristiche a bassa varianza in head_df dopo la normalizzazione. Ora usa il selettore di caratteristiche VarianceThreshold per rimuovere queste caratteristiche.

Questo esercizio fa parte del corso

Riduzione della dimensionalità in Python

Visualizza corso

Istruzioni dell'esercizio

  • Crea il selettore con soglia di varianza pari a 0.001.
  • Normalizza il DataFrame head_df dividendolo per i suoi valori medi e adatta il selettore.
  • Crea una maschera booleana dal selettore usando .get_support().
  • Crea un DataFrame ridotto passando la maschera al metodo .loc[].

esercizio interattivo pratico

Prova questo esercizio completando questo codice di esempio.

from sklearn.feature_selection import VarianceThreshold

# Create a VarianceThreshold feature selector
sel = ____(threshold=____)

# Fit the selector to normalized head_df
sel.fit(____ / ____)

# Create a boolean mask
mask = sel.____

# Apply the mask to create a reduced DataFrame
reduced_df = head_df.loc[____, ____]

print(f"Dimensionality reduced from {head_df.shape[1]} to {reduced_df.shape[1]}.")
Modifica ed esegui il codice