ComeçarComece de graça

Crie um filtro de razão de valores ausentes

O data frame house_sales_df contém a variável-alvo price e diversos preditores que descrevem casas individuais e determinam seus preços de venda. Várias das features têm quantidades distintas de valores ausentes. Se a razão de valores ausentes for muito alta, a feature não será muito informativa para prever o preço da casa. Essas features podem ser removidas. Neste exercício, você vai calcular a razão de valores ausentes para cada coluna. Isso vai ajudar você a pensar em um limiar apropriado para cada coluna.

O pacote tidyverse já foi carregado para você.

Este exercício faz parte do curso

Redução de Dimensionalidade em R

Ver curso

Instruções do exercício

  • Armazene o número total de linhas de house_sales_df em n.
  • Calcule as razões de valores ausentes para cada coluna de house_sales_df e armazene em missing_vals_df.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Calculate total rows
___ <-  ___(___)

# Calculate missing value ratios
___ <- ___ %>% 
  ___(___(___(), ~ ___(___(.)))) %>% 
  pivot_longer(everything(), names_to = "feature", values_to = "num_missing_values") %>% 
  mutate(missing_val_ratio = ___ / ___)

# Display missing value ratios
missing_vals_df
Editar e executar o código