1. 学ぶ
  2. /
  3. コース
  4. /
  5. End-to-End Machine Learning

Connected

演習

クラス不均衡を見つける

Machine Learning ライフサイクルの重要な準備段階である Exploratory Data Analysis(EDA)に取り組みます。

EDA では、heart_disease_df データセットの性質や、変数同士の関係性、モデル学習に進む前に対処すべき可能性のある問題を把握できます。たとえば患者の性別など、特徴量に含まれるクラスの分布を理解することは EDA の重要なポイントです。

クラス不均衡(あるクラスのサンプル数が他より大幅に多い状態)があると、モデルの学習が偏り、多数派のクラスを優先してしまう恐れがあります。

指示

100 XP
  • sex 列のクラス分布を表示してください。