1. 学习
  2. /
  3. 课程
  4. /
  5. R에서의 차원 축소

Connected

练习

라쏘 회귀를 위한 데이터 스케일링

라쏘 회귀 모델을 적합하기 전에, 모든 피처가 서로 비교 가능하도록 데이터를 스케일링하는 것이 중요합니다. King County, California의 전체 주택 거래 데이터는 house_sales_df에 있습니다.

이번 연습에서는 데이터를 학습용과 테스트용으로 분리하기 전에 목표 변수 price를 별도로 스케일링합니다. 이는 tidymodels의 레시피 동작 방식 때문입니다. 레시피에는 목표 변수 변환을 포함하지 않습니다.

tidyverse와 tidymodels 패키지는 미리 로드되어 있습니다.

说明

100 XP
  • house_sales_df에서 목표 변수 price를 scale()로 스케일링하세요.
  • 학습용 데이터에 80%가 들어가도록 학습/테스트 세트를 생성하세요.
  • 학습 데이터를 사용해 모든 숫자형 예측 변수를 스케일링하는 레시피를 만드세요.