1. เรียนรู้
  2. /
  3. Courses
  4. /
  5. Очищення даних у Python

Connected

Exercises

Відстежте кошти

У цій вправі ви працюєте з іншою версією датафрейму banking, яка містить пропущені значення як у стовпці cust_id, так і в стовпці acct_amount.

Ви хочете проаналізувати, скільки у банку унікальних клієнтів, середню суму на рахунках клієнтів тощо. Ви розумієте, що рядки з відсутніми cust_id не допоможуть у цьому, а в середньому acct_amount зазвичай у 5 разів перевищує inv_amount.

У цій вправі ви видалите з banking рядки з пропущеними cust_id, а також імпутуєте пропущені значення acct_amount, використовуючи галузеві знання.

คำแนะนำ

100 XP
  • Використайте .dropna(), щоб видалити пропущені значення у стовпці cust_id в banking, і збережіть результат у banking_fullid.
  • Використайте inv_amount, щоб обчислити оцінені суми на рахунках для banking_fullid, встановивши суми рівними inv_amount * 5, і запишіть результат у acct_imp.
  • Імпутуйте пропущені значення acct_amount у banking_fullid щойно створеним acct_imp, використовуючи .fillna().