1. Învăţa
  2. /
  3. Courses
  4. /
  5. Preprocesare pentru Machine Learning în Python

Connected

exercise

Codificarea variabilelor categoriale

Există câteva coloane în setul de date despre OZN-uri care trebuie codificate înainte de a putea fi utilizate într-un model prin scikit-learn. Vei realiza această transformare aici, folosind atât codificarea binară, cât și codificarea one-hot.

Instrucțiuni

100 XP
  • Folosind apply(), scrie o funcție lambda condiționată care returnează 1 dacă valoarea este "us", altfel returnează 0.
  • Afișează numărul de valori .unique() din coloana type.
  • Folosind pd.get_dummies(), creează un set codificat one-hot al coloanei type.
  • În final, folosește pd.concat() pentru a concatena variabilele codificate din type_set la setul de date ufo.