1. 学ぶ
  2. /
  3. コース
  4. /
  5. Python で学ぶ Machine Learning のための特徴量エンジニアリング

Connected

演習

列の二値化

数値はそのまま使えることも多いですが、状況によっては何らかの加工が有効な場合があります。たとえば、値の大きさそのものには関心がなく、方向性だけ、あるいは存在するかどうかだけが重要になることがあります。こうした場面では、列を二値化すると便利です。so_survey_df には、無償(給与なし)で働いている回答者が多く含まれています。ここでは各人が有償かどうか(給与が 0 より大きいか)を示す Paid_Job という新しい列を作成します。

指示

100 XP
  • まず、0 で埋めた Paid_Job という新しい列を作成します。
  • 対応する ConvertedSalary が 0 より大きい行では、Paid_Job の値を 1 に置き換えます。