1. 学ぶ
  2. /
  3. コース
  4. /
  5. Python으로 범주형 데이터 다루기

Connected

演習

특정 열에 대한 원-핫 인코딩

근처 중고차 판매점에서 차량 판매 가격을 예측하는 일을 도와 달라고 요청했어요. 전체 used_cars 데이터셋에 원-핫 인코딩을 적용하면 새 데이터셋의 열이 1,200개가 넘습니다. 이렇게 하면 가격을 예측하기 위한 Machine Learning 모델을 학습할 때 문제가 생길 수 있어 걱정되네요. 더 단순한 접근을 시도해, 몇몇 열에만 원-핫 인코딩을 적용하기로 했습니다.

指示

100 XP
  • 다음 열에 원-핫 인코딩을 적용해 새 데이터셋 used_cars_simple을(를) 만드세요: "manufacturer_name", "transmission" (이 순서로).
  • 새로 생성되는 모든 열의 접두사를 "dummy"로 설정해, 새로 만든 열만 쉽게 필터링할 수 있도록 하세요.