1. Learn
  2. /
  3. Cursuri
  4. /
  5. Preprocesare pentru Machine Learning în Python

Connected

exercițiu

Codificarea variabilelor categorice – one-hot

Una dintre coloanele setului de date volunteer, category_desc, conține descrieri de categorii pentru oportunitățile de voluntariat listate. Deoarece este o variabilă categorică cu mai mult de două categorii, trebuie să folosim codificarea one-hot pentru a transforma această coloană în valori numerice. Folosește funcția pd.get_dummies() din pandas pentru a face acest lucru.

Instrucțiuni

100 XP
  • Aplică get_dummies() pe coloana volunteer["category_desc"] pentru a crea coloanele codificate și atribuie rezultatul variabilei category_enc.
  • Afișează .head() al variabilei category_enc pentru a examina coloanele codificate.