Pas een filter op de verhouding ontbrekende waarden toe
Nu je de verhoudingen van ontbrekende waarden hebt berekend, kun je een filter maken met een drempelwaarde voor ontbrekende waarden. In deze oefening kiezen we een willekeurige, maar redelijke, drempel voor de verhouding ontbrekende waarden en passen die toe op alle kolommen. In de praktijk denk je hier kritisch over na en pas je de drempel per feature aan.
De missing_vals_df met de verhoudingen die je in de vorige oefening hebt berekend en het house_sales_df-dataframe zijn beschikbaar. Het pakket tidyverse is ook voor je geladen.
Deze oefening maakt deel uit van de cursus
Dimensionality Reduction in R
Oefeninstructies
- Gebruik
missing_vals_dfen een drempel van 0.5 om een filter voor de verhouding ontbrekende waarden te maken en sla dit op inmissing_vals_filter. - Pas
missing_vals_dftoe ophouse_sales_dfom de dimensionaliteit te verkleinen en sla het nieuwe dataframe op infiltered_house_sales_df.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Create the missing values filter
___ <- ___ %>%
___(___ <= ___) %>%
___(___)
# Apply the missing values filter
filtered_house_sales_df <- ___ %>%
___(___)
# Display the first five rows of data
___ %>% ___(___)