1. 학습
  2. /
  3. 강의
  4. /
  5. Python으로 배우는 마케팅용 Machine Learning

Connected

연습 문제

고객 제품 구매 데이터셋 탐색

동영상 연습에서 고객별 제품 구매 데이터셋을 살펴보았고, 이제 변수들의 분포와 변수 간 관계를 이해하기 위해 탐색적 차트를 그릴 준비가 되셨습니다. 여기서는 wholesale 데이터셋을 탐색하고, seaborn 라이브러리의 pairplot 함수를 사용해 변수들 간의 쌍별 관계와 각 변수의 추정 분포를 함께 그려 보겠습니다. 분포 유형과 변수 간 관계를 파악하는 것은 이후에 필요한 데이터 전처리 여부를 판단하는 데 중요한 단계입니다.

pandas 라이브러리는 pd, seaborn은 sns, matplotlib.pyplot은 plt로 로드되어 있습니다. 또한 wholesale 데이터셋은 pandas DataFrame으로 불러와져 있습니다.

지침

100 XP
  • wholesale 데이터셋의 헤더를 출력하세요.
  • 변수들 간의 쌍별 관계를 그리세요.
  • 차트를 표시하세요.