1. Learn
  2. /
  3. Cursuri
  4. /
  5. Ingineria caracteristicilor pentru Machine Learning în Python

Connected

exercițiu

Codificare one-hot și variabile dummy

Pentru a utiliza variabile categorice într-un model de învățare automată, trebuie mai întâi să le reprezinți cantitativ. Cele mai comune două abordări sunt codificarea one-hot a variabilelor sau utilizarea variabilelor dummy. În acest exercițiu, vei crea ambele tipuri de codificare și vei compara seturile de coloane rezultate. Vom continua să folosim același DataFrame din lecția anterioară, încărcat ca so_survey_df, cu accent pe coloana Country.

Instrucțiuni 1/2

undefined XP
  • 1

    Aplică codificarea one-hot pe coloana Country, adăugând „OH" ca prefix pentru fiecare coloană.

  • 2

    Creează variabile dummy pentru coloana Country, adăugând „DM" ca prefix pentru fiecare coloană.