1. Nauka
  2. /
  3. Kursy
  4. /
  5. Redukcja wymiarowości w R

Connected

ćwiczenie

Tworzenie przepisu usuwającego silnie skorelowane cechy

Po zidentyfikowaniu silnie skorelowanych cech zamiast usuwać je ręcznie, możesz skorzystać z kroku step_corr() w pakiecie tidymodels. step_corr() nie usuwa wszystkich cech skorelowanych z innymi – stara się usunąć ich jak najmniej. Koncepcyjnie, jak widzieć mogłeś w ćwiczeniu wielokrotnego wyboru, usuwa cechę, która w największym stopniu pokrywa się z dowolną kombinacją pozostałych cech. Chodzi o to, że pozostałe cechy zawierają te same informacje, więc informacja z usuniętej cechy jest nadal reprezentowana przez inne.

Pakiety tidyverse i tidymodels zostały już wczytane.

Instrukcje

100 XP
  • Utwórz przepis, który używa step_corr() z progiem 0,7, stosując ten krok wyłącznie do numerycznych predyktorów.
  • Zastosuj przepis do house_sales_df i zapisz przefiltrowane dane w filtered_house_sales_df.
  • Użyj tidy(), aby sprawdzić, którą kolumnę lub kolumny usunął filtr step_corr().