1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Pythonで学ぶ次元削減

Connected

Bài tập

糖尿病分類器を構築する

Pima Indians の糖尿病データセットを使って、ある人が糖尿病かどうかをロジスティック回帰で予測します。このデータセットには 8 つの特徴量と 1 つの目的変数があります。データは学習用とテスト用に分割済みで、X_train、y_train、X_test、y_test として読み込まれています。

StandardScaler() のインスタンスは scaler、LogisticRegression() のインスタンスは lr としてあらかじめ用意されています。

Hướng dẫn

100 XP
  • トレーニング特徴量に対してスケーラーを fit し、同時に transform まで実行します。
  • スケーリングしたトレーニングデータでロジスティック回帰モデルを学習します。
  • テスト特徴量をスケーリングします。
  • スケーリングしたテストセットで糖尿病の有無を予測します。