1. 학습
  2. /
  3. 강의
  4. /
  5. Python으로 Machine Learning을 활용한 CTR 예측

Connected

연습 문제

첫걸음

이번 연습 문제에서는 기본적인 DataFrame 연산으로 샘플 데이터를 간단히 살펴보고, CTR을 처음으로 확인해 보겠습니다. 데이터는 글로벌 광고 플랫폼인 Avazu에서 제공되며, 다양한 웹사이트와 앱에서 서로 다른 기기 유형으로 발생한 사용자 상호작용을 담고 있어요.

목표 변수는 click 열에 있습니다. hour는 YYMMDDHH 형식이며, 정수형 열로는 기기 유형을 나타내는 device_type, 배너 광고(디스플레이 광고)의 위치를 나타내는 banner_pos 등이 있어요. 그 외 변수들은 이후 장에서 다룹니다.

DataFrame 형태의 샘플 데이터는 df로 로드되어 있으며, pandas는 pd로 워크스페이스에 준비되어 있어요.

지침

100 XP
  • .isin()을 사용해 변수 X를 정의하세요. X는 click 열을 제외한 모든 열이 됩니다.
  • 변수 y를 정의하세요. df.click으로 접근할 수 있습니다.
  • y에서 값이 1인 행의 비율(샘플 CTR)을 y.sum()을 사용해 출력하세요.