1. Learn
  2. /
  3. Курси
  4. /
  5. Опрацювання даних у pandas

Connected

вправа

Ефективні підсумки

Хоч у pandas і NumPy є безліч функцій, іноді вам може знадобитися інша функція, щоб підсумувати дані.

Метод .agg() дає змогу застосувати власні користувацькі функції до датафрейму, а також застосовувати функції одразу до кількох стовпців датафрейму, роблячи агрегування надзвичайно ефективним. Наприклад,

df['column'].agg(function)

У користувацькій функції для цієї вправи "IQR" — це міжквартильний розмах: 75-й перцентиль мінус 25-й. Це альтернатива стандартному відхиленню, корисна, якщо у ваших даних є викиди.

sales доступний, а pandas імпортовано як pd.

Інструкції 1/3

undefined XP
  • 1
    • Використайте користувацьку функцію iqr, визначену для вас, разом із .agg(), щоб вивести IQR для стовпця temperature_c у sales.
  • 2
    • Оновіть вибір стовпців, щоб використати користувацьку функцію iqr з .agg() і вивести IQR для temperature_c, fuel_price_usd_per_l та unemployment — у такому порядку.
  • 3
    • Оновіть набір функцій агрегування, які викликає .agg(): додайте iqr і "median" — у такому порядку.