1. 학습
  2. /
  3. 강의
  4. /
  5. Tidyverse로 하는 데이터 모델링

Connected

연습 문제

주택 면적의 Log10 변환

예측 변수 sqft_living이 오른쪽으로 치우친 분포(right-skewed)를 보여 주었고, 이를 바로잡기 위해 밑이 10인 로그 변환이 적절하다는 것을 방금 확인하셨죠. 영상에서 결과 변수 price를 변환해 log10_price를 만든 것처럼, 이번에는 sqft_living에도 같은 작업을 해 봅시다.

지침 1/2

undefined XP
    1
    2
  • dplyr의 mutate()를 사용해 sqft_living에 log10() 변환을 적용하고, 새 열 log10_size를 만들어 house_prices_2에 할당하세요.