1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Dealing with Missing Data in Python

Connected

cvičení

Imputace průměrem a mediánem

Imputace chybějících hodnot je nejlepší metodou, když pracuješ s velkým množstvím dat. Mezi nejjednodušší způsoby patří doplnění konstantou, průměrem proměnné nebo jinými základními statistickými parametry, jako je medián či modus.

V tomto cvičení doplníš chybějící hodnoty pomocí průměru a mediánu pro každý ze sloupců. DataFrame diabetes je už načtený. K dispozici máš také SimpleImputer() z sklearn.impute.

Instrukce 1/2

undefined XP
  • 1
    • Vytvoř objekt SimpleImputer() pro imputaci průměrem.
    • Imputuj zkopírovaný DataFrame.
  • 2
    • Vytvoř objekt SimpleImputer() pro imputaci mediánem.
    • Imputuj zkopírovaný DataFrame.