1. Nauka
  2. /
  3. Kursy
  4. /
  5. Redukcja wymiarowości w R

Connected

ćwiczenie

Tworzenie przepisu odrzucającego cechy o niskiej wariancji

Pakiet tidymodels oferuje wygodniejszy sposób filtrowania cech o zerowej i bliskiej zeru wariancji – za pomocą funkcji step_zv() i step_nzv(). Te kroki przepisu analizują liczbę unikalnych wartości oraz stosunek częstości najczęściej występujących wartości w każdej cesze. Takie podejście jest bardziej niezawodne niż proste odcięcie według wartości wariancji, którego używaliśmy wcześniej.

Dodatkowo skorzystasz z kroku step_scale(), aby unormować wariancję cech. Normalizacja danych to dobra praktyka – sprawia, że wariancje różnych cech stają się ze sobą porównywalne.

Do wykonania ćwiczenia możesz korzystać ze zbioru danych house_sales_df. Zmienną docelową jest price. Pakiety tidyverse i tidymodels zostały już wczytane.

Instrukcje

100 XP
  • Zdefiniuj przepis z filtrem niskiej wariancji i przygotuj go na podstawie house_sales_df.
  • Zastosuj przepis do house_sales_df i zapisz przefiltrowane dane w zmiennej filtered_house_sales_df.
  • Wyświetl cechy odfiltrowane przez przepis w kroku step_nzv().