1. Nauka
  2. /
  3. Kursy
  4. /
  5. Zwycięstwo w konkursie Kaggle w Pythonie

Connected

ćwiczenie

Kroswalidacja k-krotna

Zaczniesz od praktycznego ćwiczenia z najczęściej stosowaną metodą kroswalidacji k-krotnej.

Dane, z którymi będziesz pracować, pochodzą z konkursu Kaggle "Two Sigma Connect: Rental Listing Inquiries". Zadanie polega na wieloklasowej klasyfikacji ogłoszeń wynajmu do 3 klas: niskie zainteresowanie, średnie zainteresowanie i wysokie zainteresowanie. Dla lepszej wydajności będziesz pracować z próbką zawierającą 1 000 obserwacji.

Musisz zaimplementować strategię walidacji k-krotnej i sprawdzić rozmiary poszczególnych foldów. DataFrame train jest już dostępny w twoim środowisku.

Instrukcje

100 XP
  • Utwórz obiekt KFold z 3 foldami.
  • Użyj pętli, aby przejść przez kolejne podziały za pomocą obiektu kf.
  • Dla każdego podziału wybierz foldy treningowy i testowy, korzystając z train_index i test_index.