1. 학습
  2. /
  3. 강의
  4. /
  5. Python으로 데이터 정제하기

Connected

연습 문제

우리 데이터의 무결성은 어떤가요?

새로운 데이터가 banking DataFrame에 병합되어 inv_amount 열의 투자 금액이 네 개의 서로 다른 펀드 A, B, C, D에 어떻게 배분되었는지에 대한 세부 정보를 담고 있어요.

또한 고객의 나이와 생일은 각각 age와 birth_date 열에 저장되어 있어요.

연령대별로 고객이 어떻게 투자하는지 파악하고 싶지만, 먼저 분석할 데이터가 올바른지 확인하려고 해요. 이를 위해 inv_amount와 age 값을 각각 펀드별 투자 금액과 고객의 생년월일과 교차 검증할 거예요. pandas와 datetime은 각각 pd와 dt로 이미 임포트되어 있어요.

지침 1/2

undefined XP
  • 1
    • banking에서 fund_columns의 모든 열을 행 기준으로 합한 값이 inv_amount 열과 같은 행을 찾으세요.
    • 일치하는 inv_amount를 가진 banking의 값을 consistent_inv에, 일치하지 않는 값을 inconsistent_inv에 저장하세요.
  • 2
    • 오늘 날짜를 today에 저장하고, 고객의 나이를 수동으로 계산해 ages_manual에 저장하세요.
    • banking에서 age 열이 ages_manual과 같은 모든 행을 찾은 다음, banking을 consistent_ages와 inconsistent_ages로 필터링하세요.