1. 학습
  2. /
  3. 강의
  4. /
  5. Python으로 데이터 정제하기

Connected

연습 문제

돈의 흐름을 따라가 보세요

이 연습 문제에서는 cust_id 열과 acct_amount 열에 누락값이 있는 또 다른 버전의 banking DataFrame을 사용합니다.

은행에 몇 명의 고유 고객이 있는지, 고객이 보유한 평균 금액은 얼마인지 등을 분석하려고 해요. cust_id가 누락된 행은 큰 도움이 되지 않는다는 것과, 평균적으로 acct_amount가 보통 inv_amount의 5배 수준이라는 점을 알고 있습니다.

이번 과제에서는 cust_id가 누락된 banking의 행을 삭제하고, 도메인 지식을 활용해 누락된 acct_amount 값을 보정(impute)할 거예요.

지침

100 XP
  • .dropna()를 사용해 banking의 cust_id 열에서 누락값이 있는 행을 제거하고 결과를 banking_fullid에 저장하세요.
  • banking_fullid에서 inv_amount * 5로 계좌 금액을 추정해 계산하고, 결과를 acct_imp에 할당하세요.
  • .fillna()를 사용해 banking_fullid의 acct_amount 누락값을 새로 만든 acct_imp로 보정하세요.