1. 学ぶ
  2. /
  3. コース
  4. /
  5. Pythonで学ぶアンサンブル手法

Connected

演習

映画の収益を予測する

映画の収益を予測するチャレンジを、まずはシンプルな線形回帰から始めましょう。'budget' 特徴量に基づいて映画の対数収益を推定します。ここで使う評価指標は RMSE(root mean squared error、二乗平均平方根誤差)です。scikit-learn では、sklearn.metrics モジュールの mean_squared_error() 関数で MSE を計算し、その平方根を numpy で取ることで求められます。

movies データセットはすでに読み込まれ、学習用とテスト用に分割されています。さらに、欠損値は 0 で置き換え済みです。入力特徴量は StandardScaler() を使って標準化しました。Machine Learning の前処理について詳しく学びたい方は、DataCamp のデータクリーニングや特徴量エンジニアリングのコースもぜひご覧ください。

指示

100 XP
  • 既定の LinearRegression モデルをインスタンス化します。
  • テストデータに対する予測値を計算します。
  • RMSE を計算します。mean_squared_error() 関数は 2 つの引数、y_test とその後に予測値を取ります。