1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Machine Learning with Tree-Based Models in R

Connected

cvičení

Důležitost proměnných

Už víš, že bagged trees jsou ensemblový model, který překonává problém vysoké variance u rozhodovacích stromů. Teď ses navíc naučil/a, že algoritmus náhodného lesa to ještě vylepšuje tím, že v každém stromě používá jen náhodnou podmnožinu příznaků. To ensemble dále dekoreluje a zlepšuje jeho prediktivní výkon.

V tomto cvičení si sám/sama sestavíš náhodný les a zobrazíš důležitost prediktorů pomocí balíčku vip. Trénovací data customers_train jsou předem načtena v tvém pracovním prostředí.

Pokyny

100 XP
  • Vytvoř spec — specifikaci klasifikačního modelu náhodného lesa s využitím enginu "ranger" a důležitostí proměnných "impurity".
  • Vytvoř model nafitováním tibble customers_train na spec, přičemž jako výstupní proměnnou použij still_customer a všechny ostatní sloupce jako prediktory.
  • Zobraz důležitost proměnných pomocí funkce vip() z balíčku vip (který není předem načtený).