1. Uczyć się
  2. /
  3. Courses
  4. /
  5. R에서 결측치 다루기

Connected

Exercise

결측치에 대한 다른 요약

데이터 유형에 따라 특히 유용한 결측치 요약 함수들이 있습니다. 예를 들어, miss_var_span()과 miss_var_run()이 있습니다.

  • miss_var_span()은 지정한 변수에서 반복 구간(span)마다 결측값이 몇 개인지 계산합니다. 이는 시계열 데이터에서 주간(7일) 등 주기적인 결측 패턴을 살피는 데 매우 유용합니다.

  • miss_var_run()은 결측치의 "연속 구간"(run) 또는 "스트릭"의 개수를 계산합니다. 예를 들어 5개 연속으로 관측치가 있고 그다음 5개가 결측인 패턴처럼, 비정상적인 결측 패턴을 찾는 데 도움이 됩니다.

miss_var_span()과 miss_var_run()은 모두 dplyr의 group_by 연산자와 함께 사용할 수 있습니다.

Instrukcje

100 XP

naniar의 pedestrian 데이터셋을 사용해서 다음을 수행하세요:

  • miss_var_span()을 사용해 변수별 결측치 요약을 구하세요. span은 4000으로 설정하세요.
  • miss_var_run()을 사용해 사례(행)별 결측치 요약을 구하세요.
  • dplyr의 group_by 연산자와 month를 결합해 보세요.