1. 学ぶ
  2. /
  3. コース
  4. /
  5. Pythonで挑むKaggleコンペティション

Connected

演習

Kaggleフォーラムのアイデアを試す

残念ながら、フォーラムの投稿やKernelの内容が必ずしもあなたのモデルに有用とは限りません。パイプラインに闇雲に取り入れるのではなく、まずは検証してみましょう。

ここでは、引数に学習用データセットを取り、3分割のクロスバリデーションで算出した全体の検証用RMSE(root mean squared error)を返す関数 get_cv_score() が用意されています。train DataFrame はすでにワークスペースに読み込まれています。

Kaggleフォーラムのさまざまな提案を試して、検証スコアが改善するかを確認してください。

指示1 / 2

undefined XP
  • 1
    • 提案1:passenger_count 特徴量は役に立たない —— 本当か確認しましょう。この特徴量を削除してスコアを比較します。
  • 2
    • 1つ目の提案はうまくいきました。提案2:pickup_latitude と distance_km の合計は良い特徴量である —— 試してみましょう!