1. 학습
  2. /
  3. 강의
  4. /
  5. Python으로 Machine Learning을 활용한 CTR 예측

Connected

연습 문제

새로운 피처 만들기

Feature engineering에는 실제로 새로운 피처를 만드는 작업도 포함됩니다. 새로운 피처를 생성하는 일은 모델의 예측 정확도가 이러한 피처에 크게 의존하기 때문에 중요해요. 이 연습 문제에서는 데이터에서 정수형으로 보이지만 사실 범주형 값을 나타내는 세 개의 열의 속성을 확인합니다. 이 세 열은 search_engine_type, product_type, advertiser_type입니다. 이 세 열과 함께 device_id, site_id에 대해서도 카운트 피처를 만들 거예요. 이 카운트 피처는 각 열의 범주별 클릭 수를 나타내며, 이후 예측에 사용됩니다.

작업 공간에는 pandas 모듈이 pd로 제공되며, 예제 DataFrame은 df로 로드되어 있습니다.

지침

100 XP
  • feature_list 목록에 있는 각 피처에 대해 전체 값의 개수와 고유 값의 개수를 출력하세요.
  • .transform()을 사용해 new_feature_list에 있는 피처별로 클릭 수를 계산하여 새로운 피처를 만드세요.