1. 학습
  2. /
  3. 강의
  4. /
  5. R로 배우는 시각화 베스트 프랙티스

Connected

연습 문제

히스토그램에서 KDE로

이번 연습에서는 "Heavy Duty Truck"에 발부된 딱지 데이터의 일부를 살펴보려고 합니다. 데이터에 밝은 트럭 운전사라고 가정하고, 도로에서 가장 위험한 시간이 언제인지 알고 싶다고 해볼게요. 표본 크기는 32개 관측치에 불과하다는 점에 유의하세요.

ggplot으로 기본 히스토그램을 그리는 코드를 아래에 제공했습니다. 예상대로 그다지 좋지 않아요. 데이터가 충분하지 않아 30개 구간을 채우지도 못하니, 읽기도 어렵고 분포를 파악하기도 힘듭니다. 지오메트리를 geom_density()를 사용해 KDE로 바꾸세요. 마지막으로, 시각화의 투명성을 높이기 위해, 사용한 KDE의 구간 너비를 알려 주는 부제목을 플롯에 추가하세요.

지침

100 XP
  • 히스토그램 지오메트리를 밀도 지오메트리(geom_density())로 변경하세요.
  • 기본 구간 너비를 1.5 단위로 수정하세요.
  • 커널의 구간 너비를 독자에게 알리기 위해, 플롯에 subtitle "Gaussian kernel SD = 1.5"를 추가하세요.