1. Learn
  2. /
  3. Cursuri
  4. /
  5. Modele Liniare Generalizate în Python

Connected

exercițiu

Compararea valorilor prezise

În exercițiul anterior, ai antrenat atât un model de regresie liniară, cât și un GLM (logistic) folosind datele crab, prezicând y în funcție de width. Cu alte cuvinte, ai vrut să estimezi probabilitatea ca o femelă să aibă un crab satelit în apropiere, în funcție de lățimea ei.

În acest exercițiu, vei analiza mai îndeaproape probabilitățile estimate (rezultatele) furnizate de cele două modele și vei încerca să determini dacă regresia liniară ar fi potrivită pentru această problemă.

Practica obișnuită este să testezi modelul pe date noi, nevăzute. Un astfel de set de date se numește eșantion de testare. Eșantionul test a fost creat pentru tine și încărcat în spațiul de lucru. Reține că ai nevoie de valori de test pentru toate variabilele prezente în model — în acest caz, width.

Setul de date crab a fost preîncărcat în spațiul de lucru.

Instrucțiuni

100 XP
  • Folosind print(), afișează setul test.
  • Folosind eșantionul test, calculează probabilitățile estimate apelând .predict() pe modelul liniar antrenat model_LM și salvează rezultatul ca pred_lm. De asemenea, calculează probabilitățile estimate apelând .predict() pe modelul GLM (logistic) salvat ca model_GLM și salvează rezultatul ca pred_glm.
  • Folosind DataFrame() din pandas, combină predicțiile ambelor modele și salvează rezultatul ca predictions.
  • Concatenează test și predictions și salvează ca all_data. Afișează all_data folosind print().