1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Proiectarea fluxurilor de lucru pentru Machine Learning în Python

Connected

Bài tập

Statistici de validare încrucișată

Ai folosit grid search CV pentru a ajusta clasificatorul tău de tip random forest și acum vrei să inspectezi rezultatele validării încrucișate, pentru a te asigura că nu ai supraantrenat modelul. Mai exact, vrei să calculezi diferența dintre scorul mediu de testare pentru fiecare fold și scorul mediu de antrenament. Setul de date este disponibil ca X_train și y_train, pipeline-ul ca pipe, iar mai multe module sunt preîncărcate, inclusiv pandas ca pd și GridSearchCV().

Hướng dẫn

100 XP
  • Creează un obiect de tip grid search cu trei fold-uri de validare încrucișată și asigură-te că returnează atât statistici de antrenament, cât și de testare.
  • Antrenează obiectul de tip grid search pe datele de antrenament.
  • Stochează rezultatele validării încrucișate, disponibile în atributul cv_results_ al obiectului CV antrenat, într-un dataframe.
  • Afișează diferența dintre coloana care conține scorul mediu de testare și cea care conține scorul mediu de antrenament.