Recursos com baixa variância
No exercício anterior, você definiu que 0,001 é um bom limiar para filtrar recursos de baixa variância em head_df após a normalização. Agora use o seletor de recursos VarianceThreshold para remover esses recursos.
Este exercício faz parte do curso
Redução de Dimensionalidade em Python
Instruções do exercício
- Crie o seletor de limiar de variância com um limiar de 0,001.
- Normalize o DataFrame
head_dfdividindo-o por seus valores médios e ajuste o seletor. - Crie uma máscara booleana a partir do seletor usando
.get_support(). - Crie um DataFrame reduzido passando a máscara para o método
.loc[].
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
from sklearn.feature_selection import VarianceThreshold
# Create a VarianceThreshold feature selector
sel = ____(threshold=____)
# Fit the selector to normalized head_df
sel.fit(____ / ____)
# Create a boolean mask
mask = sel.____
# Apply the mask to create a reduced DataFrame
reduced_df = head_df.loc[____, ____]
print(f"Dimensionality reduced from {head_df.shape[1]} to {reduced_df.shape[1]}.")