1. Learn
  2. /
  3. Courses
  4. /
  5. Очищення даних у Python

Connected

Exercise

Як щодо цілісності наших даних?

До датафрейму banking було додано нові дані, що містять деталі про те, як інвестиції у стовпці inv_amount розподілено між чотирма фондами A, B, C та D.

Крім того, вік і дні народження клієнтів тепер зберігаються у стовпцях age та birth_date відповідно.

Ви хочете зрозуміти, як інвестують клієнти різних вікових груп. Однак спершу потрібно переконатися, що дані для аналізу коректні. Ви зробите це, виконавши міжполе́ву перевірку значень inv_amount та age проти сум, інвестованих у різні фонди, і днів народження клієнтів. І pandas, і datetime вже імпортовано як pd та dt відповідно.

Instructions 1/2

undefined XP
  • 1
    • Знайдіть рядки, де сума всіх рядків зі fund_columns у banking дорівнює значенню у стовпці inv_amount.
    • Збережіть рядки banking із узгодженим inv_amount у consistent_inv, а з неузгодженим — у inconsistent_inv.
  • 2
    • Збережіть сьогоднішню дату в today та вручну обчисліть вік клієнтів, зберігши його в ages_manual.
    • Знайдіть усі рядки banking, де стовпець age дорівнює ages_manual, а потім відфільтруйте banking у consistent_ages і inconsistent_ages.