1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Redukce dimenzionality v R

Connected

Cvičení

Sestavení kompletního modelu náhodného lesa

Modely náhodného lesa přirozeně provádějí výběr příznaků, protože při stavbě mnoha podstromů vycházejí z náhodných podmnožin dostupných příznaků. Jedním ze způsobů, jak pochopit důležitost příznaků, je sestavit model a z něj důležitosti příznaků extrahovat. V tomto cvičení použiješ data Healthcare Job Attrition k natrénování klasifikačního modelu rand_forest(), ze kterého pak důležitosti příznaků vyčteš. Aby byly důležitosti příznaků dostupné, nezapomeň model vytvořit s parametrem importance = "impurity". K dispozici máš sady train a test.

Balíčky tidyverse, tidymodels a vip jsou již načteny.

Pokyny

100 XP
  • Definuj klasifikační model náhodného lesa se 200 stromy, ze kterého bude možné extrahovat důležitosti příznaků.
  • Natrénuj model náhodného lesa na všech prediktorech.
  • Připoj předpovědi k testovací sadě.
  • Vypočítej metriku F1.