1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Dealing with Missing Data in Python

Connected

cvičení

Analýza shrnutí lineárního modelu

Analyzovat výkonnost různých imputovaných modelů je jeden z nejdůležitějších kroků při práci s chybějícími daty. Určuje, na který imputovaný DataFrame se můžeš spolehnout. Pro analýzu můžeš na imputovaném DataFramu natrénovat lineární regresní model a sledovat různé parametry, které ovlivňují výběr metody imputace.

V tomto cvičení máš k dispozici DataFrame diabetes_cc, což je kompletní případ diabetického DataFramu. Kompletní případ slouží jako základ pro srovnání s ostatními imputovanými DataFramy. Pro vytvoření lineárního regresního modelu a generování souhrnů použiješ balíček statsmodels.api načtený jako sm.

Pokyny 1/4

undefined XP
    1
    2
    3
    4
  • Nastav všechny příznaky z DataFramu diabetes_cc jako X přidáním konstanty, přičemž sloupec 'Class' vylučeš a nastavíš jako y.