1. Uczyć się
  2. /
  3. Courses
  4. /
  5. R 중급 회귀

Connected

Exercise

여러 변수를 한눈에 시각화하기

변수가 늘어날수록 한 번에 모두를 그려 보기란 점점 더 어려워집니다. 두 개의 수치형 변수에는 x축과 y축을 쓰고, 세 번째 수치형 변수에는 색을, 범주형 변수에는 패싯을 사용할 수 있어요. 이 정도가 해석 가능한 한계이며, 그 이상은 그래프를 이해하기가 매우 어려워집니다. 상관관계 히트맵이나 평행좌표 그림처럼 더 많은 변수를 다룰 수 있는 특수한 그래프도 있지만, 각 변수에 대한 정보가 훨씬 줄어들고 모델 예측을 시각화하는 데에도 그다지 좋지 않습니다.

이번에는 산점도의 한계를 조금 밀어붙여, 집값, MRT 역까지의 거리, 인근 편의점 수, 주택 연식을 한 그래프에 모두 담아 보겠습니다.

taiwan_real_estate를 사용할 수 있고, ggplot2는 로드되어 있습니다.

Instrukcje

100 XP
  • taiwan_real_estate 데이터셋을 사용해, dist_to_mrt_m의 제곱근을 x축, n_convenience를 y축으로 하고 price_twd_msq로 색을 입힌 산점도를 그리세요.
  • 연속형 viridis의 plasma 색상 스케일을 사용하세요.
  • house_age_years로 패싯을 감싸도록 설정하세요.