1. Learn
  2. /
  3. Courses
  4. /
  5. Python으로 배우는 Machine Learning 특성 공학

Connected

Exercise

원-핫 인코딩과 더미 변수

Machine Learning 모델에서 범주형 변수를 사용하려면, 먼저 정량적으로 표현해야 해요. 가장 흔한 두 가지 방법은 변수를 원-핫 인코딩하거나 더미 변수를 사용하는 거예요. 이 연습 문제에서는 두 가지 인코딩을 모두 만들고, 생성된 열 집합을 비교해 볼 거예요. 이전 레슨에서 사용한 동일한 DataFrame so_survey_df를 계속 사용하며, Country 열에 집중하겠습니다.

Instructions 1/2

undefined XP
  • 1

    Country 열을 원-핫 인코딩하고, 각 열의 접두사로 "OH"를 추가하세요.

  • 2

    Country 열에 대해 더미 변수를 만들고, 각 열의 접두사로 "DM"을 추가하세요.