1. Nauka
  2. /
  3. Kursy
  4. /
  5. Uogólnione modele liniowe w Pythonie

Connected

ćwiczenie

Model liniowy a binarna zmienna odpowiedzi

W materiale wideo widziałeś przykład dopasowania modelu liniowego do binarnej zmiennej odpowiedzi i to, jak szybko mogą pojawić się problemy. Poznałeś sposób, w jaki na podstawie prostej liniowej można uzyskać wartości dopasowane \(\hat{y}\), które nie są zgodne z logiką problemu – zmienna odpowiedzi przyjmuje bowiem wartości 0 i 1.

Korzystając z wczytanego zbioru danych crab, zbadasz ten efekt, modelując y jako funkcję x w ramach frameworku GLM.

Przypomnij sobie, że formuła modelu GLM ma postać:

glm(formula = 'y ~ X', data = my_data, family = sm.families.____).fit()

gdzie podajesz argumenty formula, data i family.

Pamiętaj też, że GLM z:

  • rodziną Gaussowską to model liniowy (szczególny przypadek GLM),
  • rodziną dwumianową to model regresji logistycznej.

Instrukcje

100 XP
  • Korzystając ze zbioru danych crab, zdefiniuj formułę modelu tak, aby y było przewidywane na podstawie width.
  • Aby dopasować model liniowy przy użyciu formuły GLM, użyj Gaussian() jako argumentu family – zakłada on, że y jest zmienną ciągłą o przybliżonym rozkładzie normalnym.
  • Aby dopasować model logistyczny przy użyciu formuły GLM, użyj Binomial() jako argumentu family.
  • Dopasuj model za pomocą glm() z odpowiednimi argumentami, a następnie użyj print() i summary(), aby wyświetlić podsumowania dopasowanych modeli.