1. Lära sig
  2. /
  3. Courses
  4. /
  5. R로 배우는 Machine Learning 기반 마케팅 분석

Connected

exercise

데이터 살펴보기

워크스페이스에 salesData 데이터셋이 로드되어 있습니다. 이 데이터셋에는 1~3개월차의 고객 정보가 들어 있으며, 4개월차의 매출만 포함되어 있습니다. 아래 표는 의미가 바로 드러나지 않는 일부 변수의 설명입니다.

Variable Description
id 고객 식별 번호
mostFreqStore 가장 자주 구매한 매장
mostFreqCat 가장 많이 구매한 카테고리
nCats 서로 다른 카테고리 수
preferredBrand 가장 선호하여 주로 구매한 브랜드
nBrands 서로 다른 브랜드 수

패키지 readr, dplyr, corrplot, ggplot2가 설치 및 로드되어 있습니다.

Instruktioner

100 XP
  • 데이터 개요를 확인하기 위해 구조 확인 명령 str()을 사용하세요.
  • 이제 지난 3개월의 연속형 설명 변수들과 이번 달 매출 변수 간의 상관관계를 시각화하세요. cor()와 corrplot() 함수, 그리고 파이프 연산자를 사용하면 됩니다. 필요한 변수 선택은 이미 완료되어 있습니다.
  • 추가로, 범주형 변수 preferredBrand의 수준에 따른 salesThisMon 분포를 보여주는 박스플롯을 만드세요. 같은 작업이 범주형 종속 변수 mostFreqStore에 대해서도 이미 수행되어 있습니다.