1. 학습
  2. /
  3. 강의
  4. /
  5. R 중급 회귀

Connected

연습 문제

여러 설명 변수를 시각화하기

로지스틱 회귀도 여러 개의 설명 변수를 지원합니다. 선형 회귀와 마찬가지로, 시각화에서는 숫자 변수를 더 많이 포함할수록 금방 어려워집니다. 여기서는 두 개의 숫자형 설명 변수가 있는 경우를 살펴보고, 해결책은 이전과 거의 같습니다: 반응값(response)을 색으로 나타내는 것입니다.

여기서는 반응값이 두 가지(0과 1)만 가능하고, 이후 예측값을 추가하면 값은 모두 0과 1 사이에 위치합니다. 예측값을 포함하면, 플롯에서 가장 중요한 것은 예측이 0에 가까운지, 1에 가까운지를 파악하는 일입니다. 그래서 0.5에서 나뉘는 2색 그라디언트가 매우 유용합니다. 0.5보다 큰 예측은 한 가지 색, 0.5보다 작은 예측은 다른 색으로 표시됩니다.

은행 이탈(churn) 데이터셋은 churn으로 제공되며, ggplot2는 로드되어 있습니다.

지침

100 XP
  • churn 데이터셋을 사용해 구매 최신성 time_since_last_purchase를 고객 관계 기간 time_since_first_purchase에 대해 플롯하고, 고객 이탈 여부 has_churned로 색을 지정하세요.
  • 점 레이어를 추가하고 투명도는 0.5로 설정하세요.
  • 중간값이 0.5인 2색 그라디언트를 사용하세요.
  • 흑백 테마를 사용하세요.