Crie um filtro de razão de valores ausentes
O data frame house_sales_df contém a variável-alvo price e diversos preditores que descrevem casas individuais e determinam seus preços de venda. Várias das features têm quantidades distintas de valores ausentes. Se a razão de valores ausentes for muito alta, a feature não será muito informativa para prever o preço da casa. Essas features podem ser removidas. Neste exercício, você vai calcular a razão de valores ausentes para cada coluna. Isso vai ajudar você a pensar em um limiar apropriado para cada coluna.
O pacote tidyverse já foi carregado para você.
Este exercício faz parte do curso
Redução de Dimensionalidade em R
Instruções do exercício
- Armazene o número total de linhas de
house_sales_dfemn. - Calcule as razões de valores ausentes para cada coluna de
house_sales_dfe armazene emmissing_vals_df.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Calculate total rows
___ <- ___(___)
# Calculate missing value ratios
___ <- ___ %>%
___(___(___(), ~ ___(___(.)))) %>%
pivot_longer(everything(), names_to = "feature", values_to = "num_missing_values") %>%
mutate(missing_val_ratio = ___ / ___)
# Display missing value ratios
missing_vals_df