1. 学习
  2. /
  3. 课程
  4. /
  5. R에서 결측치 다루기

Connected

练习

섀도 매트릭스 데이터 만들기

결측값은 보통 스스로 드러나지 않고 데이터 사이에 숨어 있어서 다루기 까다로울 수 있어요.

결측값을 더 잘 드러내는 한 가지 방법은 데이터를 바라보는 방식을 바꾸는 것입니다. 즉, 모든 개별 값이 결측인지 아닌지를 중심으로 생각하는 거예요.

R의 as_shadow() 함수는 데이터프레임을 섀도 매트릭스(shadow matrix)로 변환합니다. 섀도 매트릭스는 값이 결측(NA)이거나 결측이 아님(!NA)을 나타내는 특수한 데이터 형식입니다.

섀도 매트릭스의 열 이름은 원래 데이터와 같지만, 접미사 _NA가 추가됩니다.

데이터 값과 해당 결측 상태를 함께 추적하고 비교하려면 bind_shadow() 함수를 사용하세요. 이렇게 원래 데이터에 섀도 매트릭스 열을 결합한 형식을 nabular 데이터라고 합니다.

说明

100 XP

oceanbuoys 데이터셋을 사용하세요:

  • as_shadow()로 섀도 매트릭스 데이터를 만드세요
  • bind_shadow()로 섀도를 원래 데이터에 결합해 nabular 데이터를 만드세요
  • bind_shadow(only_miss = TRUE)를 사용해 결측이 있는 변수만 결합하세요