1. 학습
  2. /
  3. 강의
  4. /
  5. Python을 활용한 고객 세분화

Connected

연습 문제

데이터 전처리

세그멘테이션의 첫 단계는 데이터를 전처리하는 일입니다. 로그 변환을 적용한 다음, 클러스터링을 위해 데이터를 정규화하겠습니다.

RFMT 값을 포함한 데이터셋은 datamart_rfmt로 로드되어 있습니다. 또한 pandas 라이브러리는 pd로, numpy는 np로 불러와 두었습니다.

콘솔에서 확장된 RFMT 데이터셋을 자유롭게 살펴보셔도 됩니다.

지침

100 XP
  • StandardScaler를 임포트하고 초기화한 뒤 scaler로 저장하세요.
  • 원본 RFMT 데이터에 로그 변환을 적용하세요.
  • 스케일러를 초기화하고 로그 변환된 데이터에 대해 fit 하세요.
  • 변환을 수행해 스케일된 데이터를 datamart_rfmt_normalized로 저장하세요.