1. Learn
  2. /
  3. Courses
  4. /
  5. Machine Learning s balíčkem caret v R

Connected

Exercise

Kombinování metod předzpracování

Argument preProcess funkce train() není omezený jen na imputaci chybějících hodnot. Nabízí celou řadu dalších technik předzpracování, které ti jako datovému vědci/vědkyni výrazně usnadní práci. Celý seznam najdeš zadáním ?preProcess do konzole – otevře se ti stránka nápovědy k této funkci.

Jednou z obzvláště užitečných skupin funkcí předzpracování pro regresní modely je standardizace: centrování a škálování. Nejdřív provedeme centrování – od každé hodnoty ve sloupci odečteme průměr daného sloupce. Pak přistoupíme ke škálování – každou hodnotu vydělíme směrodatnou odchylkou.

Standardizace transformuje data tak, že u každého sloupce bude průměr roven 0 a směrodatná odchylka 1. Regresním modelům to výrazně usnadní nalezení dobrého řešení.

Instructions 1/2

undefined XP
  • 1

    V pracovním prostředí máš načtené objekty breast_cancer_x a breast_cancer_y. Natrénuj logistický regresní model s mediánovou imputací, ulož ho jako model a vypiš ho do konzole.

  • 2

    Rozšiř model o dva další kroky předzpracování: centrování a škálování.