1. Learn
  2. /
  3. Courses
  4. /
  5. PythonでMachine Learningを使ってCTRを予測する

Connected

Exercise

欠損値の確認

欠損値を把握することは分析にとって重要です。同じデータセットを使って、データセット内の行と列の両方で反復処理し、欠損値の総数を取得します。欠損値が見つかった場合は、sklearn の Imputer を使うなど、対処のための追加手法が必要です。欠損値を適切に処理しないと、正しく CTR を予測するのが難しくなります。

サンプルデータは DataFrame 形式で df として読み込まれています。pandas は pd としてワークスペースで利用できます。

Instructions

100 XP
  • .info() を使って列の基本的なサマリーを表示します。
  • .isnull() を使って列ごとの欠損値を表示します(かっこを忘れないでください!)。
  • axis = 1 と .sum() を使って、行ごとの欠損値の合計を表示します。