1. Nauka
  2. /
  3. Kursy
  4. /
  5. Uczenie maszynowe z modelami drzewiastymi w R

Connected

ćwiczenie

Ważność zmiennych

Wiesz już, że drzewa pakowane (bagged trees) to model zespołowy, który rozwiązuje problem wariancji w drzewach decyzyjnych. Teraz dowiedziałeś się, że algorytm lasu losowego idzie o krok dalej – w każdym drzewie używa tylko losowego podzbioru cech. Dzięki temu drzewa w zespole są jeszcze bardziej niezależne od siebie, co przekłada się na lepszą skuteczność predykcyjną modelu.

W tym ćwiczeniu samodzielnie zbudujesz las losowy i zwizualizujesz ważność predyktorów za pomocą pakietu vip. Dane treningowe customers_train są już wczytane do środowiska.

Instrukcje

100 XP
  • Utwórz spec – specyfikację klasyfikacyjnego modelu lasu losowego z silnikiem "ranger" i ważnością zmiennych "impurity".
  • Utwórz model, dopasowując tibble customers_train do spec – użyj still_customer jako zmiennej wynikowej, a wszystkich pozostałych kolumn jako predyktorów.
  • Zwizualizuj ważność zmiennych za pomocą funkcji vip() z pakietu vip (pakiet nie jest wczytany automatycznie).