Características con baja varianza
En el ejercicio anterior determinaste que 0.001 es un buen umbral para filtrar las características de baja varianza en head_df después de la normalización. Ahora usa el selector de características VarianceThreshold para eliminar estas características.
Este ejercicio forma parte del curso
Reducción de dimensionalidad en Python
Instrucciones del ejercicio
- Crea el selector con un umbral de 0.001.
- Normaliza el DataFrame
head_dfdividiéndolo por sus valores medios y ajusta el selector. - Crea una máscara booleana a partir del selector usando
.get_support(). - Crea un DataFrame reducido pasando la máscara al método
.loc[].
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
from sklearn.feature_selection import VarianceThreshold
# Create a VarianceThreshold feature selector
sel = ____(threshold=____)
# Fit the selector to normalized head_df
sel.fit(____ / ____)
# Create a boolean mask
mask = sel.____
# Apply the mask to create a reduced DataFrame
reduced_df = head_df.loc[____, ____]
print(f"Dimensionality reduced from {head_df.shape[1]} to {reduced_df.shape[1]}.")