1. Learn
  2. /
  3. Courses
  4. /
  5. XGBoost로 익히는 Extreme Gradient Boosting

Connected

Exercise

범주형 열 인코딩 III: DictVectorizer

이제 파이프라인으로 들어가기 전에 마지막으로 한 가지 요령을 살펴보겠습니다. 방금 수행하신 두 단계(LabelEncoder 후에 OneHotEncoder)는 DictVectorizer를 사용하면 더 간단히 처리할 수 있어요.

DataFrame을 사전(dict)으로 변환한 뒤 DictVectorizer를 적용하면, 라벨 인코딩과 원-핫 인코딩을 한 번에 모두 수행할 수 있습니다.

이번 연습 문제에서는 이 방법을 직접 적용해 보세요!

Instructions

100 XP
  • sklearn.feature_extraction에서 DictVectorizer를 임포트하세요.
  • .to_dict() 메서드에 인수로 "records"를 사용해 df를 사전으로 변환하고, 이를 df_dict라고 하세요.
  • 키워드 인수 sparse=False로 DictVectorizer 객체를 생성하고 이름을 dv로 하세요.
  • .fit_transform() 메서드를 사용해 df_dict에 DictVectorizer를 적용하세요.
  • 결과의 처음 다섯 행과 vocabulary를 출력하려면 'Submit Answer'를 누르세요.