1. 学ぶ
  2. /
  3. コース
  4. /
  5. R ユーザーのための Python

Connected

演習

ダミー変数

コースの最後の演習では、数値以外の列をダミーエンコードして、モデリングのためのデータを準備します。 例えば、'Male'と'Female'の値が入った性別の列がある場合、各観測値が'Male'か'Female'かを示す別々の列を作成します。このようにダミー変数を作成するプロセスは、ワンホットエンコーディングとも呼ばれます。

pandasのget_dummies()関数を使うと、数値以外の列をダミー変数に変換できます。

df_new = pd.get_dummies(df)

何が起きているかをわかりやすく確認できるよう、flights DataFrameをサブセット化してflights_subを作成しています。

指示1 / 3

undefined XP
    1
    2
    3

flights_subの最初の5行を表示しましょう。