1. सीखें
  2. /
  3. पाठ्यक्रम
  4. /
  5. PythonでMachine Learningを使ってCTRを予測する

Connected

अभ्यास

4つのカテゴリを評価する

混同行列は、真陽性 (TP)、偽陽性 (FP)、真陰性 (TN)、偽陰性 (FN) の4つの結果カテゴリを確認するための最も直接的なツールです。この演習では、sklearn の標準的な決定木分類器 DecisionTreeClassifier() をサンプルのクリックデータに適用し、4つのカテゴリごとの内訳を計算します。

pandas モジュールは作業環境で pd として利用でき、サンプルの DataFrame は df に読み込まれています。特徴量は X、目的変数は y に読み込まれており、そのまま使えます。さらに、sklearn.tree から DecisionTreeClassifier が利用可能です。

निर्देश

100 XP
  • X と y の学習用・テスト用の分割を作成します。
  • 決定木分類器を定義し、モデルを学習して予測 y_pred を作成します。
  • 混同行列を使い、各結果カテゴリの件数を取得します。ここで 1 はポジティブ(クリック)、0 はネガティブ(非クリック)を表します。
  • たとえば、真陰性は [0,0]、真陽性は [1,1] になります。