1. Learn
  2. /
  3. Courses
  4. /
  5. PythonでMachine Learningを使ってCTRを予測する

Connected

Exercise

カテゴリ変数の変換

sklearn のモデルは数値特徴量を入力として必要とするため、カテゴリ変数を数値にエンコードすることが重要です。最も一般的な手法は「ワンホットエンコーディング」ですが、実装は簡単な一方でメモリ消費が大きくなります。そこで本演習では、各カテゴリ列に対してハッシング手法を用い、カテゴリ値を数値に写像します。

pandas モジュールは作業環境で pd として利用可能で、サンプルの DataFrame は df として読み込まれています。

Instructions

100 XP
  • データ型でフィルタリングして、カテゴリ列を選択します。
  • 各カテゴリ列にハッシュ関数を適用します。