1. 学ぶ
  2. /
  3. コース
  4. /
  5. scikit-learn で学ぶ Supervised Learning

Connected

演習

R-squared のクロスバリデーション

クロスバリデーションは、モデルを評価するうえで非常に重要な手法です。利用可能なすべてのデータで学習と評価の両方を行うため、モデルが使えるデータ量を最大化できます。

この演習では、線形回帰モデルを構築し、SNS 広告費から売上を予測する精度を 6 分割のクロスバリデーションで評価します。6 分割それぞれの個別スコアを表示します。

sales_df データセットは、目的変数の y と特徴量の X に分割済みで読み込まれています。LinearRegression は sklearn.linear_model からインポート済みです。

指示

100 XP
  • KFold と cross_val_score をインポートします。
  • 分割数を 6、shuffle を True、シードを 5 に設定して KFold() を呼び出し、kf を作成します。
  • reg を使って X と y に対してクロスバリデーションを実行し、cv に kf を渡します。
  • cv_scores を出力します。