1. 学ぶ
  2. /
  3. コース
  4. /
  5. PythonでMachine Learningを使ってCTRを予測する

Connected

演習

最初のステップ

この演習では、基本的な DataFrame 操作を使ってサンプルデータをさっと確認し、CTR を最初に見ていきます。データはグローバルな主要広告プラットフォームである Avazu からのもので、さまざまなデバイス種類における、複数のウェブサイトやアプリでのユーザー行動を記録しています。

目的変数は click 列にあります。時刻は YYMMDDHH 形式で、いくつかの整数列があります。たとえば、デバイスの種類を表す device_type、バナー広告(ディスプレイ広告とも呼ばれます)の掲載位置を表す banner_pos などです。他の変数については後の章で扱います。

DataFrame 形式のサンプルデータは df として読み込まれています。pandas は pd としてワークスペースで利用できます。

指示

100 XP
  • .isin() を使って変数 X を定義します。X は click 列以外のすべての列になります。
  • 変数 y を定義します。df.click で参照できます。
  • y のうち値が 1 の行の割合、つまりサンプルの CTR を y.sum() を使って出力します。