1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Manipulace s daty v pandas

Connected

Cvičení

Efektivní souhrny

Pandas a NumPy nabízejí spoustu funkcí, ale někdy potřebuješ data shrnout jiným způsobem.

Metoda .agg() ti umožňuje aplikovat vlastní funkce na DataFrame a zároveň je použít na více sloupců najednou – agregace jsou tak mnohem efektivnější. Například:

df['column'].agg(function)

Ve vlastní funkci pro toto cvičení je "IQR" zkratka pro interkvartilové rozpětí – tedy hodnota 75. percentilu minus 25. percentil. Jde o alternativu ke směrodatné odchylce, která se hodí zejména tehdy, když data obsahují odlehlé hodnoty.

sales je k dispozici a pandas je načtený jako pd.

Pokyny 1/3

undefined XP
  • 1
    • Pomocí vlastní funkce iqr a metody .agg() vypiš IQR sloupce temperature_c z sales.
  • 2
    • Uprav výběr sloupců tak, aby vlastní funkce iqr spolu s .agg() vypočítala IQR pro sloupce temperature_c, fuel_price_usd_per_l a unemployment – v tomto pořadí.
  • 3
    • Uprav agregační funkce volané přes .agg(): zahrň iqr a "median" – v tomto pořadí.