1. Учиться
  2. /
  3. Courses
  4. /
  5. Python으로 배우는 Machine Learning 특성 공학

Connected

Exercise

드물게 나타나는 범주 처리하기

어떤 특성은 매우 많은 범주를 가질 수 있지만, 각 범주의 등장 빈도는 고르지 않을 수 있어요. 예를 들어, Data Science에서 즐겨 사용하는 프로그래밍 언어를 생각해 보면, 흔한 선택지는 Python, R, Julia 등이지만, FORTRAN, C처럼 개별적인 선택도 존재합니다. 이런 경우에는 각 값마다 피처를 만들기보다, 더 자주 나타나는 값들만 대상으로 피처를 만드는 편이 좋습니다.

Инструкции 1 / 3

undefined XP
    1
    2
    3
  • so_survey_df의 Country 열을 시리즈로 추출해 countries에 할당하세요.
  • 새로 만든 countries 시리즈에서 각 범주의 빈도를 구하세요.