1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Procvičování otázek z kódovacích pohovorů v Pythonu

Connected

Cvičení

Imputace chybějících hodnot NaN

Zkusíme imputovat chybějící hodnoty pomocí metody .transform(). V předchozím úkolu jsi vytvořil/a DataFrame fheroes, ze kterého byly odstraněny všechny skupiny s nedostatečným počtem pozorování sloupce bmi. Sloupec bmi ale stále obsahuje hodně chybějících hodnot (NaN). Máš k dispozici dvě kopie DataFramu fheroes (imp_globmean a imp_grpmean). Tvojí úlohou je nahradit hodnoty NaN ve sloupci bmi — v první kopii celkovým průměrem, ve druhé průměrem příslušné skupiny definované faktory Publisher a Alignment.

Tip: pandas Series i NumPy pole mají speciální metodu .fillna(), která nahradí všechny nalezené hodnoty NaN hodnotou zadanou jako argument.

Pokyny

100 XP
  • Definuj lambda funkci, která nahradí hodnoty NaN v series jejím průměrem.
  • Ve sloupci bmi DataFramu imp_globmean nahraď hodnoty NaN celkovým průměrem.
  • Ve sloupci bmi DataFramu imp_grpmean nahraď hodnoty NaN průměrem příslušné skupiny.