1. Nauka
  2. /
  3. Kursy
  4. /
  5. Uczenie maszynowe w analizie marketingowej w R

Connected

ćwiczenie

Unikanie wielokoliniowości

Wróćmy do zbioru danych salesData, który jest już wczytany w środowisku. Dodatkowo załadowana jest biblioteka rms.

Szacujmy wielokrotną regresję liniową! Chcemy oczywiście wykorzystać wszystkie zmienne dostępne w zbiorze danych.

Instrukcje

100 XP
  • Zbuduj pełny model o nazwie salesModel1, używając wszystkich zmiennych z wyjątkiem id, aby wyjaśnić sprzedaż w bieżącym miesiącu. W tym celu uzupełnij poniższy wzorzec odpowiednimi nazwami zmiennych: response ~ . - excluded_variable. Można to odczytać jako: „response modelowane przez wszystkie zmienne z wyjątkiem excluded_variable."
  • Oszacuj współczynniki inflacji wariancji za pomocą funkcji vif() z biblioteki rms.
  • Oprócz wykluczenia zmiennej id, usuń także zmienne preferredBrand i nBrands, aby uniknąć wielokoliniowości. Zrób to, poprzedzając każdą z nich znakiem -. Zapisz model w obiekcie o nazwie salesModel2.
  • Ponownie oszacuj współczynniki inflacji wariancji dla tego modelu. Czy teraz wyniki są do przyjęcia?