1. Learn
  2. /
  3. Cursuri
  4. /
  5. Proiectarea fluxurilor de lucru pentru Machine Learning în Python

Connected

exercițiu

Ingineria caracteristicilor

Ai sarcina de a prezice dacă un nou grup de solicitanți de credite va intra sau nu în incapacitate de plată. Dispui de un set de date istorice și dorești să antrenezi un clasificator pe baza acestuia. Observi că multe caracteristici sunt în format text, ceea ce reprezintă o problemă pentru clasificatoarele tale. Prin urmare, decizi să codifici numeric coloanele de tip text folosind LabelEncoder(). Funcția a fost preîncărcată pentru tine din submodulul preprocessing al sklearn. Setul de date credit este, de asemenea, preîncărcat, la fel și o listă cu numele tuturor coloanelor al căror tip de date este text, stocată în non_numeric_columns.

Instrucțiuni 1/3

undefined XP
    1
    2
    3
  • Inspectează primele trei linii din setul tău de date folosind .head().