ComenzarEmpieza gratis

Características con baja varianza

En el ejercicio anterior determinaste que 0.001 es un buen umbral para filtrar las características de baja varianza en head_df después de la normalización. Ahora usa el selector de características VarianceThreshold para eliminar estas características.

Este ejercicio forma parte del curso

Reducción de dimensionalidad en Python

Ver curso

Instrucciones del ejercicio

  • Crea el selector con un umbral de 0.001.
  • Normaliza el DataFrame head_df dividiéndolo por sus valores medios y ajusta el selector.
  • Crea una máscara booleana a partir del selector usando .get_support().
  • Crea un DataFrame reducido pasando la máscara al método .loc[].

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

from sklearn.feature_selection import VarianceThreshold

# Create a VarianceThreshold feature selector
sel = ____(threshold=____)

# Fit the selector to normalized head_df
sel.fit(____ / ____)

# Create a boolean mask
mask = sel.____

# Apply the mask to create a reduced DataFrame
reduced_df = head_df.loc[____, ____]

print(f"Dimensionality reduced from {head_df.shape[1]} to {reduced_df.shape[1]}.")
Editar y ejecutar código