1. Learn
  2. /
  3. Cursuri
  4. /
  5. Gestionarea datelor lipsă în Python

Connected

exercițiu

Analizează rezumatul modelului liniar

Analizarea performanței diferitelor modele imputate reprezintă una dintre cele mai importante sarcini în gestionarea datelor lipsă. Aceasta determină tipul de DataFrame imputat pe care te poți baza. Pentru analiză, poți antrena un model de regresie liniară pe DataFrame-ul imputat și verifica diferiți parametri care influențează alegerea tipului de imputare.

În acest exercițiu, DataFrame-ul diabetes_cc a fost deja încărcat — acesta reprezintă cazul complet al DataFrame-ului pentru diabet. Cazul complet servește drept bază de comparație față de celelalte DataFrame-uri imputate. Vei folosi pachetul statsmodels.api încărcat ca sm pentru a crea un model de regresie liniară și a genera rezumate.

Instrucțiuni 1/4

undefined XP
    1
    2
    3
    4
  • Setează toate caracteristicile din DataFrame-ul diabetes_cc ca X, adăugând o constantă, și exclude coloana 'Class', pe care o vei seta ca y.