1. 학습
  2. /
  3. 강의
  4. /
  5. Python으로 Machine Learning을 활용한 CTR 예측

Connected

연습 문제

첫 번째 CTR 모델

이 연습에서는 Avazu 데이터셋에 대해 의사결정나무를 사용해 첫 CTR 모델을 만들고, sklearn의 accuracy_score()로 모델 정확도를 평가해 보겠습니다. 추가로, 이전처럼 직접 분할 지점을 정하는 대신 sklearn의 train_test_split()을 사용해 학습용과 테스트용 데이터를 나눕니다.

작업 공간에는 df라는 DataFrame 형태의 샘플 데이터와 함께 sklearn, pandas(별칭 pd)가 로드되어 있어요.

기본적인 학습/테스트 분할을 수행한 뒤 accuracy로 결과를 평가하겠습니다.

지침

100 XP
  • click 열을 기준으로 각각 특징과 타깃이 되도록 X와 y를 정의하세요.
  • train_test_split(X, y)를 사용해 데이터를 학습용과 테스트용으로 분할하세요.
  • 의사결정나무 분류기를 생성하세요.
  • 분류기로 예측을 만들고, 예측의 정확도를 평가하세요.