1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Prediktivní analytika pomocí síťových dat v R

Connected

cvičení

Korelované proměnné

V tomto cvičení prozkoumáš dataset z pohledu korelovaných proměnných. Před aplikací binárního klasifikátoru je důležité je odebrat – zvláště v případě logistické regrese. Pokud jsou dvě nebo více proměnných vysoce korelovány, ponech jen jednu a ostatní odstraň.

Nejprve použijeme funkci corrplot() z balíčku corrplot k vizualizaci korelací. V korelačním grafu modrá barva znázorňuje kladnou korelaci a červená zápornou. Tmavší barva odpovídá silnější korelaci. Nakonec vysoce korelované proměnné z datasetu odstraníš.

Pokyny 1/2

undefined XP
    1
    2
  • Načti balíček corrplot.
  • Vytvoř korelační matici M pomocí funkce cor(). Funkce přijímá jako argument podmnožinu datasetu.
  • Vizualizuj korelace mezi proměnnými pomocí corrplot() a matice M.