1. Learn
  2. /
  3. Cursuri
  4. /
  5. Marketing Analytics: Predicția abandonului clienților în Python

Connected

exercițiu

Varierea dimensiunii setului de antrenament

Dimensiunea seturilor de antrenament și testare influențează performanța modelului. Modelele învață mai bine când au mai multe date de antrenament. Există însă riscul ca acestea să se supraajusteze pe datele de antrenament și să nu generalizeze bine pe date noi – prin urmare, pentru a evalua corect capacitatea de generalizare a modelului, ai nevoie de suficiente date de testare. Există, astfel, un echilibru important de găsit între cât folosești pentru antrenament și cât păstrezi pentru testare.

Până acum, ai folosit 70% din date pentru antrenament și 30% pentru testare. Hai să folosim acum 80% din date pentru antrenament și să vedem cum se schimbă performanța modelului.

Instrucțiuni 1/3

undefined XP
    1
    2
    3
  • Creează seturile de antrenament și testare, folosind 80% din date pentru antrenament și 20% pentru testare.