1. Apprendre
  2. /
  3. Cours
  4. /
  5. ETL та ELT у Python

Connected

Exercice

Групування даних у pandas

Вихід даного пайплайну зазвичай — це «модельований» набір даних. Такий набір дає споживачам даних зручний доступ до інформації без необхідності виконувати багато перетворень. Групування даних у pandas допомагає будувати модельовані набори даних.

pandas імпортовано як pd, а датафрейм raw_testing_scores містить дані у такому вигляді:

              street_address       city  math_score  reading_score  writing_score
01M539   111 Columbia Street  Manhattan       657.0          601.0          601.0
02M294      350 Grand Street  Manhattan       395.0          411.0          387.0
02M308      350 Grand Street  Manhattan       418.0          428.0          415.0

Instructions

100 XP
  • Використайте .loc[], щоб залишити лише стовпці "city", "math_score", "reading_score" і "writing_score".
  • Згрупуйте датафрейм за стовпцем "city" і знайдіть середнє значення балів з математики, читання та письма для кожного міста.
  • Використайте функцію transform(), щоб створити згрупований датафрейм.