IniziaInizia gratis

Caratteristiche a bassa varianza

Nel precedente esercizio hai stabilito che 0.001 è una buona soglia per filtrare le caratteristiche a bassa varianza in head_df dopo la normalizzazione. Ora usa il selettore di caratteristiche VarianceThreshold per rimuovere queste caratteristiche.

Questo esercizio fa parte del corso

Riduzione della dimensionalità in Python

Visualizza il corso

Istruzioni dell'esercizio

  • Crea il selettore con soglia di varianza pari a 0.001.
  • Normalizza il DataFrame head_df dividendolo per i suoi valori medi e adatta il selettore.
  • Crea una maschera booleana dal selettore usando .get_support().
  • Crea un DataFrame ridotto passando la maschera al metodo .loc[].

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

from sklearn.feature_selection import VarianceThreshold

# Create a VarianceThreshold feature selector
sel = ____(threshold=____)

# Fit the selector to normalized head_df
sel.fit(____ / ____)

# Create a boolean mask
mask = sel.____

# Apply the mask to create a reduced DataFrame
reduced_df = head_df.loc[____, ____]

print(f"Dimensionality reduced from {head_df.shape[1]} to {reduced_df.shape[1]}.")
Modifica ed esegui il codice