1. Learn
  2. /
  3. Courses
  4. /
  5. 마케팅 애널리틱스: Python으로 고객 이탈 예측하기

Connected

Exercise

이진 특성 인코딩

데이터 유형을 재지정하는 것은 데이터 전처리의 중요한 단계예요. 이 연습에서는 'Vmail_Plan'과 'Churn' 특성에서 'yes'는 1, 'no'는 0으로 할당해 보겠습니다.

영상에서는 이를 수행하는 두 가지 방법을 보셨을 거예요. 하나는 pandas를 사용하는 방법이고, 다른 하나는 scikit-learn을 사용하는 방법이었죠. 이런 단순한 작업에는 pandas를 사용하는 것을 권장하므로, 이 연습에서도 그렇게 하겠습니다. 반면, 이 강의 범위를 넘어가지만 Machine Learning 파이프라인을 구축하려는 경우에는 LabelEncoder() 사용을 살펴볼 수 있어요. 데이터 사이언스를 할 때는 하나의 작업을 수행하는 방법이 항상 하나만 있는 것이 아니며, 여러분의 애플리케이션에 가장 효과적인 방법을 선택해야 한다는 점을 기억해 주세요.

Instructions

100 XP
  • telco의 'Vmail_Plan' 열에서 'no'를 0으로, 'yes'를 1로 바꾸세요.
  • 'Churn' 열에도 동일하게 적용하세요.