1. Learn
  2. /
  3. Cursuri
  4. /
  5. Preprocesare pentru Machine Learning în Python

Connected

exercițiu

Codificarea variabilelor categorice – binare

Aruncă o privire asupra setului de date hiking. Există mai multe coloane care trebuie codificate înainte de a putea fi folosite într-un model, una dintre ele fiind coloana Accessible. Accessible este o caracteristică binară, deci are două valori – Y sau N – care trebuie transformate în 1 și 0. Folosește metoda LabelEncoder din scikit-learn pentru a realiza această transformare.

Instrucțiuni

100 XP
  • Stochează LabelEncoder() într-o variabilă numită enc.
  • Folosind metoda .fit_transform() a encoderului, codifică coloana "Accessible" din setul de date hiking. Numește noua coloană Accessible_enc.
  • Compară cele două coloane una lângă alta pentru a vedea rezultatul codificării.