1. Learn
  2. /
  3. Courses
  4. /
  5. マーケティングアナリティクス:Pythonで顧客解約を予測する

Connected

Exercise

学習用データサイズを変えてみる

学習用データとテスト用データのサイズは、モデルの性能に影響します。学習用データが多いほど、モデルはよりよく学習します。しかし、学習用データに過剰適合して新しいデータにうまく汎化できなくなるリスクもあります。モデルの汎化能力を正しく評価するには、十分なテスト用データも必要です。そのため、学習に使う割合とテストに確保する割合の間には、重要なバランスとトレードオフがあります。

これまでは学習に70%、テストに30%を使ってきました。ここでは学習に80%のデータを使い、モデル性能がどのように変化するか評価してみましょう。

Instructions 1/3

undefined XP
    1
    2
    3
  • 学習に80%、テストに20%を使うように、学習用データとテスト用データを作成します。