1. Învăţa
  2. /
  3. Courses
  4. /
  5. Python으로 Kaggle 대회 공략하기

Connected

exercise

원-핫 인코딩

레이블 인코딩의 문제점은 범주 간에 순서 관계가 있다고 암묵적으로 가정한다는 점이에요. 따라서 "RoofStyle"과 "CentralAir" 특성의 인코딩 방법을 원-핫 인코딩으로 바꿔 봅시다. House Prices Kaggle 대회의 train과 test DataFrame은 이미 작업 공간에 준비되어 있어요.

이진 특성(범주가 두 개뿐인 범주형 특성)을 다룰 때는 레이블 인코더만 적용하는 것이 권장된다는 점을 기억하세요.

여러분의 목표는 언급된 특성 중 어떤 것이 이진이 아닌지 파악하고, 그 특성에만 원-핫 인코딩을 적용하는 것입니다.

Instrucțiuni 1 / 4

undefined XP
    1
    2
    3
    4
  • pandas의 value_counts() 메서드를 사용해 "RoofStyle"과 "CentralAir" 특성의 분포를 확인하세요.