1. Nauka
  2. /
  3. Kursy
  4. /
  5. Projektowanie przepływów pracy uczenia maszynowego w Pythonie

Connected

ćwiczenie

Statystyki kroswalidacji

Do strojenia klasyfikatora losowego lasu użyto przeszukiwania siatki z kroswalidacją. Teraz chcesz sprawdzić wyniki kroswalidacji, aby upewnić się, że model nie jest przeuczony. Interesuje cię w szczególności różnica między średnim wynikiem testowym a średnim wynikiem treningowym dla każdego podziału. Zbiór danych jest dostępny jako X_train i y_train, potok jako pipe, a kilka modułów jest już wczytanych – w tym pandas jako pd oraz GridSearchCV().

Instrukcje

100 XP
  • Utwórz obiekt przeszukiwania siatki z trzema podziałami kroswalidacji i upewnij się, że zwraca statystyki zarówno treningowe, jak i testowe.
  • Dopasuj obiekt przeszukiwania siatki do danych treningowych.
  • Zapisz wyniki kroswalidacji, dostępne w atrybucie cv_results_ dopasowanego obiektu CV, do ramki danych.
  • Wyświetl różnicę między kolumną zawierającą średni wynik testowy a kolumną zawierającą średni wynik treningowy.