1. 학습
  2. /
  3. 강의
  4. /
  5. Python으로 배우는 마케팅용 Machine Learning

Connected

연습 문제

변수의 왜도 줄이기

이제 wholesale 열들을 Box-Cox 변환으로 변환한 뒤, 쌍별 관계 플롯을 살펴보며 분포의 왜도가 줄어들어 보다 정규분포에 가깝게 되었는지 확인해 볼 거예요. 이는 K-means 알고리즘이 수렴하고 관측치를 동질적인 그룹(클러스터 또는 세그먼트)으로 잘 찾도록 하는 데 매우 중요한 단계예요.

stats 모듈은 scipy 라이브러리에서 불러왔고, wholesale 데이터셋은 pandas DataFrame으로 가져온 상태예요.

지침

100 XP
  • pandas DataFrame에 적용할 수 있는 사용자 정의 Box-Cox 변환 함수를 정의하세요.
  • 해당 함수를 wholesale 데이터셋에 적용하세요.
  • 변환된 변수들 간의 쌍별 관계를 플롯하세요.
  • 차트를 표시하세요.