Aplicar um filtro por taxa de valores ausentes
Agora que você calculou as taxas de valores ausentes, pode criar um filtro usando um limite (threshold). Neste exercício, vamos escolher um limite arbitrário, mas razoável, para a taxa de valores ausentes e aplicá-lo a todas as colunas. No mundo real, você vai analisar com cuidado e personalizar o limite para cada feature.
O missing_vals_df, que contém as taxas calculadas no exercício anterior, e o data frame house_sales_df estão disponíveis para você. O pacote tidyverse também já foi carregado.
Este exercício faz parte do curso
Redução de Dimensionalidade em R
Instruções do exercício
- Use
missing_vals_dfe um limite de 0.5 para criar um filtro pela taxa de valores ausentes e armazene-o emmissing_vals_filter. - Aplique
missing_vals_dfahouse_sales_dfpara reduzir sua dimensionalidade e salve o novo data frame emfiltered_house_sales_df.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Create the missing values filter
___ <- ___ %>%
___(___ <= ___) %>%
___(___)
# Apply the missing values filter
filtered_house_sales_df <- ___ %>%
___(___)
# Display the first five rows of data
___ %>% ___(___)