1. 학습
  2. /
  3. 강의
  4. /
  5. R로 데이터 정리하기

Connected

연습 문제

주행 시간 범위 제약

범위를 벗어난 값은 분석을 흐트러뜨릴 수 있으므로 초기에 잡아내는 것이 중요해요. 이번 연습 문제에서는 duration_min 열을 더 자세히 살펴보겠습니다. 자전거는 한 번 대여 시 24시간을 초과해(즉, 1440분) 보관할 수 없지만, 일부 자전거의 문제로 반납 시각이 부정확하게 기록된 경우가 있었어요.

이번 연습에서는 잘못된 데이터를 범위 한계값(1440분)으로 대체하겠습니다. 물론 이런 값을 NA로 바꿔도 괜찮아요.

dplyr, assertive, ggplot2가 로드되어 있고 bike_share_rides를 사용할 수 있어요.

지침 1/2

undefined XP
    1
    2
  • ggplot2를 사용해 bike_share_rides의 duration_min 열로 구간 3개의 히스토그램을 만들어, 범위를 벗어난 데이터가 있는지 확인하세요.