Aan de slagGa gratis aan de slag

Pas een filter op de verhouding ontbrekende waarden toe

Nu je de verhoudingen van ontbrekende waarden hebt berekend, kun je een filter maken met een drempelwaarde voor ontbrekende waarden. In deze oefening kiezen we een willekeurige, maar redelijke, drempel voor de verhouding ontbrekende waarden en passen die toe op alle kolommen. In de praktijk denk je hier kritisch over na en pas je de drempel per feature aan.

De missing_vals_df met de verhoudingen die je in de vorige oefening hebt berekend en het house_sales_df-dataframe zijn beschikbaar. Het pakket tidyverse is ook voor je geladen.

Deze oefening maakt deel uit van de cursus

Dimensionality Reduction in R

Cursus bekijken

Oefeninstructies

  • Gebruik missing_vals_df en een drempel van 0.5 om een filter voor de verhouding ontbrekende waarden te maken en sla dit op in missing_vals_filter.
  • Pas missing_vals_df toe op house_sales_df om de dimensionaliteit te verkleinen en sla het nieuwe dataframe op in filtered_house_sales_df.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Create the missing values filter
___ <- ___ %>% 
  ___(___ <= ___) %>% 
  ___(___)

# Apply the missing values filter
filtered_house_sales_df <- ___ %>% 
  ___(___)

# Display the first five rows of data
___ %>% ___(___)
Code bewerken en uitvoeren