1. Nauka
  2. /
  3. Kursy
  4. /
  5. Redukcja wymiarowości w R

Connected

ćwiczenie

Redukcja danych z wykorzystaniem ważności cech

Mając gotowy pełny model lasu losowego, możesz teraz zbadać ważność cech.

Chociaż lasy losowe naturalnie – choć niejawnie – dokonują selekcji cech, budowanie zredukowanego modelu często przynosi dodatkowe korzyści. Zredukowany model trenuje się szybciej, generuje prognozy w krótszym czasie i jest łatwiejszy do zrozumienia oraz zarządzania. Oczywiście to zawsze kompromis między prostotą modelu a jego wydajnością.

W tym ćwiczeniu zredugujesz zbiór danych. W kolejnym ćwiczeniu dopasujemy zredukowany model i porównamy jego wydajność z modelem pełnym. Zmienne rf_fit, train i test są już dla ciebie dostępne.

Pakiety tidyverse, tidymodels i vip zostały wczytane.

Instrukcje

100 XP
  • Użyj funkcji vi() z parametrem rank, aby wyodrębnić dziesięć najważniejszych cech.
  • Dodaj zmienną docelową z powrotem do listy najważniejszych cech.
  • Zastosuj maskę najważniejszych cech, aby zredukować zbiory danych.