1. 学ぶ
  2. /
  3. コース
  4. /
  5. Python によるモデル検証

Connected

演習

見たデータ vs. 見ていないデータ

モデルは、以前に見た観測に対して精度が高くなる傾向があります。キャンディのデータセットでは、Skittles の人気度を予測するほうが Andes Mints の人気度を予測するより高精度になりやすいでしょう。Skittles はデータセットに含まれますが、Andes Mints は含まれないからです。

あなたは 50 種類のキャンディに基づいて X_train からモデルを構築しました。モデルが学習に使った 50 種類のキャンディに対してどれだけ正確に人気度を予測できるか、そして一度も見たことのない 35 種類(X_test)に対してどれだけ予測できるかを報告する必要があります。評価指標としては平均絶対誤差 mae() を用います。

指示

100 XP
  • 入力データとして X_train と X_test を使い、model.predict() で予測の配列を作成します。
  • モデルが見たことのあるデータと、見たことのないデータの両方についてモデルの精度を計算します。
  • 用意された print 文を使って、見たデータと見ていないデータの結果を出力してください。