1. Nauka
  2. /
  3. Kursy
  4. /
  5. Uogólnione modele liniowe w Pythonie

Connected

ćwiczenie

Modelowanie ze zmienną kategoryczną

W poprzednich ćwiczeniach dopasowywałeś model regresji logistycznej ze zmienną color jako zmienną objaśniającą wraz z width, traktując color jako zmienną ilościową. W tym ćwiczeniu potraktujesz color jako zmienną kategoryczną – podczas budowy macierzy modelu zostanie ona zakodowana jako 3 zmienne binarne z kodowaniem 0/1.

Pamiętaj, że domyślne kodowanie w dmatrix() używa pierwszej grupy jako grupy referencyjnej. Aby wyświetlić macierz modelu jako ramkę danych, ustaw dodatkowy argument return_type w dmatrix() na wartość 'dataframe'.

Zmienna color ma następujące naturalne porządkowanie:
1: medium light
2: medium
3: medium dark
4: dark

Zbiór danych crab jest już wczytany do przestrzeni roboczej.

Instrukcje 1/4

undefined XP
    1
    2
    3
    4
  • Zbuduj model_matrix ze zmienną color. Zmienna color powinna być traktowana jako kategoryczna, a jako grupę referencyjną ustaw 4 za pomocą funkcji Treatment().
  • Dopasuj model logistyczny ze zmienną y jako odpowiedzią i wyświetl jego wyniki.