1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Dealing with Missing Data in Python

Connected

cvičení

Imputace modem a konstantou

Doplňování chybějících hodnot průměrem, mediánem, konstantou nebo modem je ideální řešení, pokud máš v datech relativně malé množství chybějících hodnot. V předchozím cvičení jsi imputoval/a pomocí průměru a mediánu. Teď doplníš nejčastěji se vyskytující hodnoty ve sloupci a pak provedeš další imputaci s pevně danou konstantou.

Jako dříve, DataFrame diabetes a funkce SimpleImputer() jsou už načtené.

Instrukce 1/2

undefined XP
  • 1
    • Vytvoř objekt SimpleImputer() s nastavením imputace modem (nejčastější hodnotou).
    • Imputuj zkopírovaný DataFrame.
  • 2
    • Vytvoř objekt SimpleImputer() s nastavením doplňování chybějících hodnot hodnotou 0.
    • Imputuj zkopírovaný DataFrame.