Crie um filtro de baixa variância
Neste exercício, você recebe house_sales_df, que contém dezessete variáveis contínuas. Algumas dessas variáveis não têm variância. Outras têm variância muito baixa. Você vai explorar as variâncias e definir um filtro usando um limiar de variância apropriado. Essa abordagem é útil para reduzir dimensões com pouca ou nenhuma informação, mas, como você verá, tem algumas desvantagens.
Os pacotes tidyverse e tidymodels já foram carregados para você.
Este exercício faz parte do curso
Redução de Dimensionalidade em R
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Calculate feature variances
houses_sales_variances <- ___ %>%
summarize(across(everything(), ~ ___(___(., ___ = ___), na.rm = ___))) %>%
pivot_longer(everything(), names_to = "feature", values_to = "variance") %>%
___(desc(___))
houses_sales_variances