1. Nauka
  2. /
  3. Kursy
  4. /
  5. Uogólnione modele liniowe w Pythonie

Connected

ćwiczenie

Kodowanie zmiennych kategorycznych

W poprzednich ćwiczeniach tworzyłeś macierze modelu dla zmiennych ciągłych i stosowałeś transformacje zmiennych. W tym ćwiczeniu przećwiczysz sposoby kodowania zmiennej kategorycznej.

Dane kategoryczne pozwalają analizować i porównywać zależności między różnymi grupami lub czynnikami. Dlatego wybór grupy referencyjnej jest istotny – w zależności od badanego problemu możesz chcieć zmienić domyślną grupę referencyjną. Jednym z częstych powodów takiej zmiany jest to, że interpretacja oszacowań współczynników staje się bardziej trafna i interesująca w kontekście danego badania.

W tym ćwiczeniu wrócisz do zbioru danych crab, w którym color i spine są zmiennymi kategorycznymi.

Zbiór danych crab jest już wczytany do obszaru roboczego.

Instrukcje 1/2

undefined XP
    1
    2
  • Zaimportuj dmatrix z biblioteki patsy.
  • Za pomocą dmatrix() zbuduj i wyświetl macierz modelu, w której color jest zmienną kategoryczną – użyj funkcji C().