1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Dự đoán CTR với Machine Learning trong Python

Connected

Bài tập

Bắt đầu những bước đầu tiên

Trong bài tập này, bạn sẽ xem nhanh dữ liệu mẫu bằng một số thao tác cơ bản với DataFrame và có cái nhìn đầu tiên về CTR. Dữ liệu đến từ Avazu, một nền tảng quảng cáo toàn cầu hàng đầu, ghi lại tương tác của người dùng trên nhiều loại thiết bị cho các website và ứng dụng khác nhau.

Biến mục tiêu nằm ở cột click. Cột giờ có định dạng YYMMDDHH, và có một vài cột số nguyên: device_type cho loại thiết bị, banner_pos cho vị trí của quảng cáo banner (còn gọi là quảng cáo hiển thị), v.v. Sẽ còn các biến khác được đề cập ở các chương sau.

Dữ liệu mẫu dưới dạng DataFrame đã được nạp vào biến df. pandas với bí danh pd đã sẵn sàng trong không gian làm việc của bạn.

Hướng dẫn

100 XP
  • Định nghĩa biến X bằng .isin(). X sẽ là tất cả các cột trừ cột click.
  • Định nghĩa biến y, có thể truy cập bằng df.click.
  • In ra tỷ lệ các hàng của y có giá trị 1 — đây là CTR mẫu — bằng y.sum().