1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Proiectarea fluxurilor de lucru pentru Machine Learning în Python

Connected

Bài tập

Primul tău pipeline – din nou!

La startup-ul de aritmie, se apropie evaluarea lunară, iar în cadrul acesteia un programator Python experimentat îți va revizui codul. Decizi să faci ordine urmând bunele practici și să înlocuiești scriptul de selecție a caracteristicilor și clasificare cu păduri aleatoare cu un pipeline. Folosești un set de antrenament disponibil ca X_train și y_train, precum și o serie de module: RandomForestClassifier, SelectKBest() și f_classif() pentru selecția caracteristicilor, alături de GridSearchCV și Pipeline.

Hướng dẫn

100 XP
  • Creează un pipeline cu selectorul de caracteristici dat în codul exemplu și un clasificator de tip pădure aleatoare. Numește primul pas feature_selection.
  • Adaugă două perechi cheie-valoare în params: una pentru numărul de caracteristici k din selector, cu valorile 10 și 20, și una pentru n_estimators în pădure, cu valorile posibile 2 și 5.
  • Inițializează un obiect GridSearchCV cu pipeline-ul și grila de parametri date.
  • Antrenează obiectul pe date și afișează combinația de parametri cu cea mai bună performanță.