1. Lära sig
  2. /
  3. Courses
  4. /
  5. R에서 결측치 다루기

Connected

exercise

결측값은 몇 개 있나요?

새로운 데이터셋을 살펴볼 때 가장 먼저 확인해야 할 것 중 하나는 결측값이 있는지, 그리고 얼마나 있는지입니다.

are_na()로 결측값을 표시한 뒤 개수를 셀 수도 있지만, 결측값을 세는 데에 가장 효율적인 방법은 n_miss() 함수를 사용하는 것입니다. 이 함수는 데이터에 있는 결측값의 총개수를 알려 줍니다.

데이터에서 결측값의 비율은 pct_miss 함수로 구할 수 있습니다. 이 함수는 데이터에 있는 결측값의 백분율을 알려 줍니다.

이와 반대로, 결측이 아닌 값의 개수와 비율은 n_complete와 pct_complete를 사용해 확인할 수 있습니다.

Instruktioner

100 XP

키와 몸무게 예제 데이터프레임 dat_hw를 사용해 보세요:

  • 데이터프레임 dat_hw에 n_miss()를 사용해 데이터프레임의 결측값 총개수를 세세요.
  • 변수 dat_hw$weight에 n_miss()를 사용해 그 변수의 결측값 총개수를 세세요.
  • 같은 방식으로 prop_miss(), n_complete(), prop_complete()를 사용해 결측의 비율, 그리고 데이터프레임과 변수의 완전한 값의 개수와 비율을 구하세요.