1. Learn
  2. /
  3. Cursuri
  4. /
  5. Reducerea dimensionalității în R

Connected

exercițiu

Creează un filtru bazat pe rata valorilor lipsă

Data frame-ul house_sales_df conține variabila țintă price și o serie de predictori care descriu proprietăți individuale și determină prețurile lor de vânzare. Unele caracteristici au un număr variabil de valori lipsă. Dacă rata valorilor lipsă este prea mare, caracteristica respectivă nu va fi foarte utilă pentru a prezice prețul casei și poate fi eliminată. În acest exercițiu, vei calcula rata valorilor lipsă pentru fiecare coloană. Acest lucru te va ajuta să alegi un prag potrivit pentru fiecare coloană.

Pachetul tidyverse a fost deja încărcat.

Instrucțiuni

100 XP
  • Stochează numărul total de rânduri din house_sales_df în variabila n.
  • Calculează rata valorilor lipsă pentru fiecare coloană din house_sales_df și stochează rezultatele în missing_vals_df.