1. 学ぶ
  2. /
  3. コース
  4. /
  5. Pythonで学ぶ木ベースのMachine Learning

Connected

演習

基準としてエントロピーを使う

この演習では、Wisconsin Breast Cancer データセットに対して、情報基準としてエントロピーを用いる分類木を学習します。データセットに含まれる30個すべての特徴量を使用し、データは 80% を学習用、20% をテスト用に分割しています。

X_train と、ラベル配列である y_train はワークスペースで利用可能です。

指示

100 XP
  • sklearn.tree から DecisionTreeClassifier をインポートします。

  • 最大深さを 8 にして、DecisionTreeClassifier のインスタンス dt_entropy を作成します。

  • 情報基準を 'entropy' に設定します。

  • 訓練データで dt_entropy を学習させます。