1. 学ぶ
  2. /
  3. コース
  4. /
  5. PythonでMachine Learningを使ってCTRを予測する

Connected

演習

はじめの一歩

Avazu のフルデータセットを使って、列のデータ型を確認しながら新しい特徴量をいくつか見ていきます。新しいデータには site_id、app_id、device_id などのカテゴリ列が含まれており、これらはそれぞれサイト、アプリ、ユーザーの識別子です。まずは、数値列とカテゴリ列を特定して出力しましょう。

サンプルデータは DataFrame 形式で df として読み込まれています。pandas は pd の別名でワークスペースに用意されています。

指示

100 XP
  • .columns を使って df の列名を表示します。
  • .dtypes を使って df の対応するデータ型を表示します。
  • 数値列のみの df のサブセットを選択し(include = ['int', 'float'] を使用)、その列を表示します。
  • カテゴリ列のみの df のサブセットを選択し(include = ['object'] を使用)、その列を表示します。