1. Learn
  2. /
  3. Cursuri
  4. /
  5. Proiectarea fluxurilor de lucru pentru Machine Learning în Python

Connected

exercițiu

Primul tău pipeline

Colegul tău a folosit AdaBoostClassifier pentru setul de date de scoring al creditelor. Vrei să încerci și un clasificator de tip random forest. În acest exercițiu, vei antrena acest clasificator pe date și îl vei compara cu AdaBoostClassifier. Asigură-te că folosești împărțirea datelor în seturi de antrenament și de testare pentru a evita supraadaptarea. Datele sunt preîncărcate și transformate astfel încât toate caracteristicile să fie numerice. Caracteristicile sunt disponibile ca X, iar etichetele ca y. Modulul RandomForestClassifier a fost de asemenea preîncărcat.

Instrucțiuni 1/3

undefined XP
    1
    2
    3
  • Împarte datele în seturi de antrenament (X_train și y_train) și de testare (X_test și y_test). Folosește 20% din exemple pentru setul de testare.