1. 학습
  2. /
  3. 강의
  4. /
  5. Python으로 배우는 Machine Learning 특성 공학

Connected

연습 문제

표준화

정규화는 한 열의 값을 두 지점 사이로 스케일링할 때 유용하지만, 열 중 하나라도 이상치의 영향을 크게 받으면 서로 스케일된 두 열을 비교하기가 어렵습니다. 이를 해결하는 일반적인 방법이 표준화입니다. 표준화는 엄격한 상한과 하한을 두는 대신 데이터를 평균을 중심으로 재배치하고, 각 데이터 포인트가 평균에서 표준편차 몇 배만큼 떨어져 있는지를 계산해요.

지침

100 XP
  • sklearn의 preprocessing 모듈에서 StandardScaler를 임포트하세요.
  • StandardScaler()를 SS_scaler로 인스턴스화하세요.
  • so_numeric_df의 Age 열에 StandardScaler를 맞추세요(fit).
  • 방금 맞춘 스케일러로 같은 열을 변환하세요(transform).