1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Jak vyhrát soutěž na Kaggle v Pythonu

Connected

cvičení

K-fold křížová validace

Začneš tím, že si prakticky vyzkoušíš nejpoužívanější metodu K-fold křížové validace.

Data, se kterými budeš pracovat, pocházejí z Kaggle soutěže „Two Sigma Connect: Rental Listing Inquiries". Úloha spočívá v klasifikaci nabídek pronájmu do 3 tříd: nízký zájem, střední zájem a vysoký zájem. Pro lepší výkon budeš pracovat se vzorkem 1 000 pozorování.

Tvým úkolem je implementovat strategii K-fold validace a podívat se na velikosti jednotlivých foldů. DataFrame train je v tvém pracovním prostředí již k dispozici.

Pokyny

100 XP
  • Vytvoř objekt KFold se 3 foldy.
  • Pomocí objektu kf projdi smyčkou každé rozdělení.
  • Pro každé rozdělení vyber trénovací a testovací foldy pomocí train_index a test_index.