1. Nauka
  2. /
  3. Kursy
  4. /
  5. Marketing Analytics: Przewidywanie rezygnacji klientów w Pythonie

Connected

ćwiczenie

Zmiana rozmiaru zbioru treningowego

Rozmiar zbiorów treningowego i testowego ma wpływ na wydajność modelu. Modele uczą się lepiej, gdy mają więcej danych treningowych. Istnieje jednak ryzyko, że model przeuczy się na danych treningowych i słabo poradzi sobie z nowymi danymi – dlatego do prawidłowej oceny zdolności modelu do generalizacji potrzebujesz wystarczającej ilości danych testowych. W efekcie kluczowe jest zachowanie właściwej równowagi między tym, ile danych przeznaczasz na trening, a ile zatrzymujesz do testowania.

Do tej pory korzystałeś z podziału 70% na trening i 30% na testowanie. Teraz użyjemy 80% danych do treningu i sprawdzimy, jak to wpłynie na wydajność modelu.

Instrukcje 1/3

undefined XP
    1
    2
    3
  • Utwórz zbiory treningowy i testowy, przeznaczając 80% danych na trening i 20% na testowanie.