1. Učit se
  2. /
  3. Projekty
  4. /
  5. HR Analytics: Predicting Employee Churn in R

Connected

Cvičení

Detekce multikolinearity

V tomto cvičení zkontroluješ multikolinearitu mezi všemi proměnnými pomocí faktoru inflace rozptylu (VIF). VIF můžeš vypočítat funkcí vif() z balíčku car.

Hodnoty VIF najdeš ve sloupci GVIF ve výstupu a jsou zpravidla zobrazeny v exponenciálním formátu. Pokud tento formát neznáš, můžeš použít funkci format():

sample_vif_value <- 2.213e+10
format(sample_vif_value, scientific = FALSE)

"22130000000"

Pokyny

100 XP
  • Načti balíček car.
  • Zkontroluj multikolinearitu v modelu (multi_log), který jsi sestavil/a v předchozím cvičení.
  • Která proměnná má nejvyšší VIF? Přiřaď název proměnné jako řetězec do highest.