1. Learn
  2. /
  3. Cursuri
  4. /
  5. Modele Liniare Generalizate în Python

Connected

exercițiu

Tipul de date și familia de distribuție

În această lecție ai învățat diferite tipuri de date care pot fi modelate cu ajutorul modelelor liniare generalizate (GLM). În acest exercițiu vei recapitula tipurile de date și vei aplica familia de distribuție potrivită pentru a ajusta un GLM.

Instrucțiuni 1/3

undefined XP
    1
    2
    3

Întrebare

Imaginează-ți un studiu în care încerci să prezici numărul de traversări cu bicicleta peste podul Brooklyn din New York, în funcție de temperatura zilnică.

Folosește Consola pentru a vizualiza primele cinci rânduri din setul de date bike, care conține variabilele tale. În acest scop, poți folosi funcția head() din pandas.

În date vei găsi variabilele necesare pentru a antrena modelul. Cele două variabile de care ai nevoie sunt:

  1. Brooklyn_B: numărul de traversări cu bicicleta peste Podul Brooklyn
  2. Avg_Temp: temperatura zilnică medie în New York City

Vizualizezi datele folosind un grafic scatter și obții următorul rezultat:

Decizi să ajustezi un model GLM. Acum, ținând cont de variabila răspuns, numărul de traversări cu bicicleta, ce familie de distribuție ai alege pentru a ajusta un model GLM?

Răspunsuri posibile