1. 学ぶ
  2. /
  3. コース
  4. /
  5. Python によるモデル検証

Connected

演習

ホールドアウトセットを1つ作成する

上司から、tic_tac_toe データセットでシンプルなランダムフォレストモデルを作るよう依頼されました。パラメータ選択に多くの時間をかけるのではなく、そのモデルが将来のデータに対してどの程度うまく機能するかを知りたいとのことです。今後の三目並べ(Tic-Tac-Toe)の対局で、どちらのプレイヤーが勝つかをモデルで予測できると便利ですね。

tic_tac_toe データセットはすでに読み込まれています。

Python では、=\ はコードが1行では長すぎるため、2行に分割されたことを示します。

指示

100 XP
  • すべてのカテゴリ列に対してダミー変数を作成し、X データセットを作成します。
  • X と y を、学習用(X_train、y_train)とテスト用(X_test、y_test)に分割します。
  • テストサイズを10%にしてデータセットを分割します。