1. Learn
  2. /
  3. Cursuri
  4. /
  5. Proiectarea fluxurilor de lucru pentru Machine Learning în Python

Connected

exercițiu

Codificări pentru variabile categorice

Colegul tău a convertit coloanele din setul de date de credit la valori numerice folosind LabelEncoder(). A omis una: credit_history, care înregistrează istoricul de credit al solicitantului. Vrei să creezi două versiuni ale setului de date: una care folosește LabelEncoder() și alta cu codificare one-hot, pentru comparație. Matricea de caracteristici îți este disponibilă ca credit. Ai LabelEncoder() preîncărcat și pandas ca pd.

Instrucțiuni

100 XP
  • Codifică credit_history folosind LabelEncoder().
  • Concatenează rezultatul la cadrul de date original.
  • Creează un nou cadru de date prin concatenarea dummy-urilor de codificare 1-hot la cadrul original.
  • Confirmă că codificarea 1-hot produce mai multe coloane decât codificarea prin etichetă.