1. 学ぶ
  2. /
  3. コース
  4. /
  5. Python으로 Machine Learning을 활용한 CTR 예측

Connected

演習

범주형 변수 변환하기

sklearn에서는 모델 입력으로 숫자형 특성이 필요하므로, 범주형 변수를 숫자형으로 인코딩하는 것이 중요해요. 가장 일반적인 기법인 "원-핫 인코딩"은 간단하지만 메모리 사용량이 큽니다. 이를 보완하기 위해, 각 범주형 열에 대해 범주형 값을 숫자로 매핑하는 해싱 기법을 사용하겠습니다.

작업 공간에는 pd로 불러온 pandas 모듈이 준비되어 있고, 예제 DataFrame은 df로 로드되어 있어요.

指示

100 XP
  • 데이터 타입을 기준으로 필터링해 범주형 열을 선택하세요.
  • 선택한 각 범주형 열에 해시 함수를 적용하세요.