ComeçarComece de graça

Recursos com baixa variância

No exercício anterior, você definiu que 0,001 é um bom limiar para filtrar recursos de baixa variância em head_df após a normalização. Agora use o seletor de recursos VarianceThreshold para remover esses recursos.

Este exercício faz parte do curso

Redução de Dimensionalidade em Python

Ver curso

Instruções do exercício

  • Crie o seletor de limiar de variância com um limiar de 0,001.
  • Normalize o DataFrame head_df dividindo-o por seus valores médios e ajuste o seletor.
  • Crie uma máscara booleana a partir do seletor usando .get_support().
  • Crie um DataFrame reduzido passando a máscara para o método .loc[].

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

from sklearn.feature_selection import VarianceThreshold

# Create a VarianceThreshold feature selector
sel = ____(threshold=____)

# Fit the selector to normalized head_df
sel.fit(____ / ____)

# Create a boolean mask
mask = sel.____

# Apply the mask to create a reduced DataFrame
reduced_df = head_df.loc[____, ____]

print(f"Dimensionality reduced from {head_df.shape[1]} to {reduced_df.shape[1]}.")
Editar e executar o código