1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Preprocessing pro Machine Learning v Pythonu

Connected

cvičení

Agregace numerických příznaků

Agregační statistika se hodí k vytvoření nového příznaku zejména tehdy, když máš v datech více sloupců s podobnými, navzájem souvisejícími hodnotami. Tady pracuješ s DataFrame running_times_5k obsahujícím časy běhu. Pro každé jméno (name) v datasetu vypočítej průměr z pěti časů.

Pokyny

100 XP
  • Pomocí metody .loc[] vyber všechny řádky a příslušné sloupce a vypočítej jejich .mean().
  • Pomocí .head() si zobraz začátek DataFrame a ověř, že sloupec mean vznikl správně.