1. 학습
  2. /
  3. 강의
  4. /
  5. R로 배우는 신용 위험 모델링

Connected

연습 문제

누락된 데이터 삭제하기

앞서 loan_data 데이터 세트에서 고객에 따라 이자율(int_rate)이 달라진다는 것을 보았어요. 안타깝게도 일부 관측치에는 이자율이 누락되어 있어요. 이제 누락된 이자율이 몇 개인지 파악한 다음, 이를 삭제해야 합니다.

이번 연습에서는 which() 함수를 사용해 NA를 포함한 행의 인덱스를 만들어요. 그런 다음 이 인덱스를 사용해 NA가 있는 행을 삭제할 거예요.

지침

100 XP
  • summary()를 사용해 변수 int_rate의 누락된 입력 개수를 확인하세요.
  • which()와 is.na()를 사용해 이자율이 기록되지 않은 관측치의 인덱스를 만드세요. 결과를 객체 na_index에 저장하세요.
  • 누락된 이자율 관측치를 제외한 새 데이터 세트 loan_data_delrow_na를 만드세요.
  • 이전에 loan_data의 복사본 loan_data_delcol_na를 만들었음을 기억하세요. 누락된 이자율 관측치를 삭제하는 대신, int_rate 열 전체를 NULL로 설정하여 삭제하세요.