1. Learn
  2. /
  3. Courses
  4. /
  5. マーケティングアナリティクス:Pythonで顧客解約を予測する

Connected

Exercise

二値特徴量のエンコード

データ型の置き換えは、前処理でとても重要です。この演習では、'Vmail_Plan' と 'Churn' の各特徴量について、'yes' を 1、'no' を 0 に割り当てます。

動画ではこれを行う2つの方法を紹介しました。1つは pandas、もう1つは scikit-learn を使う方法です。このような単純な作業には pandas を使うのがおすすめなので、ここでもその方法で進めます。一方、機械学習のパイプラインを構築したい場合(このコースの範囲外ですが)は、LabelEncoder() の利用も検討できます。データサイエンスでは、同じ目的を達成する方法が複数あるのが常であり、自分の用途に最も効果的な方法を選ぶことが大切です。

Instructions

100 XP
  • telco の 'Vmail_Plan' 列で、'no' を 0、'yes' を 1 に置き換えます。
  • 'Churn' 列についても同様に置き換えます。