1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Redukce dimenzionality v R

Connected

Cvičení

Redukce dat pomocí důležitosti příznaků

Teď, když máš hotový úplný model náhodného lesa, se podíváš na důležitost příznaků.

Ačkoli modely náhodného lesa přirozeně — byť implicitně — provádějí výběr příznaků, bývá výhodné sestavit redukovaný model. Takový model se trénuje rychleji, generuje předpovědi rychleji a je snazší ho pochopit i spravovat. Samozřejmě jde vždy o kompromis mezi jednoduchostí a výkonem modelu.

V tomto cvičení datovou sadu zredukovánš. V dalším cvičení natrénuješ redukovaný model a porovnáš jeho výkon s úplným modelem. K dispozici máš rf_fit, train a test.

Balíčky tidyverse, tidymodels a vip jsou už načtené.

Pokyny

100 XP
  • Pomocí vi() s parametrem rank extrahuj deset nejdůležitějších příznaků.
  • Přidej cílovou proměnnou zpět do seznamu nejdůležitějších příznaků.
  • Aplikuj masku nejdůležitějších příznaků a zredukuj datové sady.