1. Learn
  2. /
  3. Courses
  4. /
  5. Preprocesare pentru Machine Learning în Python

Connected

Exercise

Modelare fără normalizare

Hai să vedem ce se poate întâmpla cu acuratețea modelului tău dacă încerci să modelezi date fără a aplica în prealabil o formă de standardizare.

Aici avem un subset al setului de date wine. Una dintre coloane, Proline, are o varianță extrem de mare față de celelalte coloane. Acesta este un exemplu în care o tehnică precum normalizarea logaritmică ar fi utilă – despre care vei învăța în secțiunea următoare.

Procesul de antrenare a unui model în scikit-learn ar trebui să îți fie deja familiar, așa că nu vom intra în prea multe detalii. Ai deja la dispoziție un model k-nearest neighbors (knn), precum și seturile X și y necesare pentru antrenare și evaluare.

Instructions

100 XP
  • Împarte seturile X și y în seturi de antrenament și de testare, asigurându-te că etichetele de clasă sunt distribuite uniform în ambele seturi.
  • Antrenează modelul knn pe caracteristicile și etichetele din setul de antrenament.
  • Afișează acuratețea modelului knn pe setul de testare, folosind metoda .score().