1. 학습
  2. /
  3. 강의
  4. /
  5. R로 데이터 정리하기

Connected

연습 문제

결측치 처리하기

이 연습 문제에서는 cust_id와 acct_amount 열에 결측치가 있는 또 다른 버전의 accounts 데이터를 다룹니다.

은행에 고유한 고객이 몇 명인지, 그리고 고객이 보유한 평균 금액이 얼마인지 파악하려고 합니다. cust_id가 누락된 행은 큰 도움이 되지 않는다는 것과, 평균적으로 acct_amount는 보통 inv_amount의 5배 수준이라는 도메인 지식을 알고 있어요.

이 연습에서는 cust_id가 없는 accounts의 행을 제거하고, 도메인 지식을 사용해 누락된 inv_amount 값을 대치(impute)합니다. dplyr과 assertive는 로드되어 있으며 accounts를 사용할 수 있습니다.

지침 1/4

undefined XP
    1
    2
    3
    4
  • cust_id가 누락된 행을 제거하도록 accounts를 필터링하고, 결과를 accounts_clean에 저장하세요.