1. 学ぶ
  2. /
  3. コース
  4. /
  5. Pythonで学ぶ予測分析入門

Connected

演習

すべての変数を離散化する

連続変数を1つずつ離散化するのではなく、自動で離散化する方が簡単です。Python で全列名のリストを取得するには、次のようにします。

variables  = basetable.columns

離散化すべきなのは連続変数だけです。ある変数を離散化するかどうかは、取りうる異なる値の数があらかじめ定めた閾値より多いかどうかで確認できます。

指示

100 XP
  • ベーステーブルのすべての列名を含むリスト variables を作成します。
  • リスト variables 内のすべての変数を確認するループを作成します。
  • 5 を超える異なる値を持つ変数だけを離散化するように、if 文を完成させます。
  • qcut メソッドを使って、連続変数を 10 個のビンに分割します。