1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Zobecněné lineární modely v Pythonu

Connected

cvičení

Lineární model a binární závislá proměnná

Ve videu jsi viděl/a příklad přizpůsobení lineárního modelu binární závislé proměnné a jak rychle může dojít k problémům. Zjistil/a jsi, že proložením přímkou lze získat odhadnuté hodnoty \(\hat{y}\), které neodpovídají logice úlohy — závislá proměnná totiž nabývá pouze hodnot 0 a 1.

Na předem načteném datasetu crab si tento efekt prozkoumáš sám/sama tím, že budeš modelovat y jako funkci x v rámci GLM.

Vzorec pro GLM má tvar:

glm(formula = 'y ~ X', data = my_data, family = sm.families.____).fit()

kde zadáváš formula, data a family.

Připomeň si, že GLM s:

  • rodinou Gaussian je lineární model (speciální případ GLM)
  • rodinou Binomial je logistický regresní model.

Pokyny

100 XP
  • Pomocí datasetu crab definuj vzorec modelu tak, aby y bylo předpovídáno proměnnou width.
  • Pro přizpůsobení lineárního modelu pomocí GLM použij jako argument family hodnotu Gaussian(), která předpokládá, že y je spojitá a přibližně normálně rozdělená proměnná.
  • Pro přizpůsobení logistického modelu pomocí GLM použij jako argument family hodnotu Binomial().
  • Přizpůsob model pomocí glm() se správnými argumenty a výsledné shrnutí zobraz pomocí print() a summary().