1. 学ぶ
  2. /
  3. コース
  4. /
  5. Pythonで学ぶアンサンブル手法

Connected

演習

UCI SECOM データの探索

この章の締めくくりとして、bagging の理解をしっかり固めるために新しいデータセットを扱ってみましょう!このデータは UCI Machine Learning Repository から取得した、半導体製造プロセスのデータです。

各行は製造対象(エンティティ)を表し、特徴量はセンサーや工程内の測定値です。ラベルは、その対象がテストに合格(1)か不合格(-1)かを表します。

データセットは読み込まれており、uci_secom として利用できます。target 変数は 'Pass/Fail' 列です。この変数を確認するために、.value_counts() と .describe() メソッドを使ってみてください。どんな点に気づきますか?

指示

50 XP

選択肢