1. Learn
  2. /
  3. Cursuri
  4. /
  5. Modele Liniare Generalizate în Python

Connected

exercițiu

Modelul liniar și o variabilă răspuns binară

În video, ai văzut un exemplu de ajustare a unui model liniar la o variabilă răspuns binară și cum lucrurile pot merge rapid în direcția greșită. Ai învățat că, pe baza dreptei ajustate, poți obține valori estimate \(\hat{y}\), care nu sunt în concordanță cu logica problemei, deoarece variabila răspuns ia valorile 0 și 1.

Folosind setul de date preîncărcat crab, vei studia acest efect modelând y ca funcție de x în cadrul GLM.

Reamintește-ți că formularea modelului GLM este:

glm(formula = 'y ~ X', data = my_data, family = sm.families.____).fit()

unde specifici formula, data și family.

De asemenea, reține că un GLM cu:

  • familia Gaussiană este un model liniar (caz special al GLM-urilor)
  • familia Binomială este un model de regresie logistică.

Instrucțiuni

100 XP
  • Folosind setul de date crab, definește formula modelului astfel încât y să fie prezis de width.
  • Pentru a ajusta un model liniar cu formula GLM, folosește Gaussian() pentru argumentul family, care presupune că y este continuă și aproximativ normal distribuită.
  • Pentru a ajusta un model logistic cu formula GLM, folosește Binomial() pentru argumentul family.
  • Ajustează un model folosind glm() cu argumentele corespunzătoare și folosește print() și summary() pentru a vizualiza rezumatele modelelor ajustate.