1. 学ぶ
  2. /
  3. コース
  4. /
  5. Pythonで学ぶExplainable AI

Connected

演習

クラスタ品質への特徴量の影響

KMeans モデルにおいて、各特徴量がクラスタリング性能に与える影響を調べましょう。データセット X は、収入、子どもの人数、家にいるティーンの人数という3つの特徴量に基づく顧客セグメンテーションに使われます。

silhouette_score 関数と column_names 変数はすでに読み込まれています。

指示

100 XP
  • 元のシルエットスコア(original_score)を求めます。
  • for ループ内で、特徴量を1つずつ削除して、その結果を X_reduced に保存します。
  • 新しいシルエットスコア(new_score)を計算します。
  • 特徴量のimpactを計算します。