1. 학습
  2. /
  3. 강의
  4. /
  5. R로 배우는 시각화 베스트 프랙티스

Connected

연습 문제

데이터가 많은 경우의 KDE

제공된 코드는 모든 단속 건에 대한 percentage_over_limit의 기본 KDE를 그립니다. 언뜻 보기에는 설정이 그럴듯해 보입니다. 데이터가 많으니 구간 너비를 1%로 아주 좁게 잡았고, 배려해서 추가한 러그 플롯의 alpha도 0.7로 낮춰 두었습니다.

하지만 코드를 실행해 보면 곧바로 좋은 플롯이 아니라는 걸 알 수 있어요. 밀도 추정선은 고슴도치처럼 뾰족뾰족하고, 러그 플롯은 겹침이 심해 사실상 두꺼운 검은 막대처럼 보입니다.

구간 너비를 2.5로 조금 키우고, 점들의 겹침 정도를 파악할 수 있도록 러그 플롯의 alpha를 0.05로 더 낮춰 고쳐 보세요. 커널 너비 변경을 반영해 부제목도 바꾸는 것, 잊지 마세요!

지침

100 XP
  • 커널 표준편차를 2.5로 변경하세요.
  • 러그 플롯의 alpha를 0.05로 설정하세요.
  • 새로운 커널 너비를 반영하도록 subtitle을 "Gaussian kernel SD = 2.5"로 변경하세요.