1. 学ぶ
  2. /
  3. コース
  4. /
  5. Pythonで挑むKaggleコンペティション

Connected

演習

K-fold 交差検証

最も一般的に使われる K-fold 交差検証を、実際に手を動かして体験していきます。

扱うデータは Kaggle コンペティション「Two sigma connect: rental listing inquiries」のものです。課題は賃貸物件の掲載を、low interest・medium interest・high interest の 3 クラスに分類する多クラス分類です。高速に処理するため、1,000 行のサブサンプルを使用します。

K-fold の検証戦略を実装し、得られた各フォールドのサイズを確認してください。train DataFrame はすでに作業スペースに用意されています。

指示

100 XP
  • 3 分割の KFold オブジェクトを作成します。
  • kf オブジェクトを使って各分割をループ処理します。
  • 各分割について、train_index と test_index を使って学習用フォールドとテスト用フォールドを選択します。