1. Learn
  2. /
  3. Курси
  4. /
  5. ETL та ELT у Python

Connected

вправа

Фільтрування датафреймів pandas

Після вилучення даних із джерельної системи настає час їх трансформувати. Часто вихідні дані містять більше інформації, ніж потрібно для подальших сценаріїв використання. Якщо так, варто зменшити розмірність під час етапу «transform» конвеєра даних.

pandas імпортовано як pd, а функція extract() доступна для завантаження датафрейму зі шляху, який ви передаєте.

Інструкції

100 XP
  • Використайте функцію extract(), щоб завантажити датафрейм, збережений за шляхом "sales_data.parquet".
  • Оновіть функцію transform(), щоб вона повертала всі рядки та стовпці з "Quantity Ordered" більшим за 1.
  • Додатково відфільтруйте датафрейм clean_data, щоб залишити лише стовпці "Order Date", "Quantity Ordered" і "Purchase Address".
  • Поверніть відфільтрований датафрейм.