1. Learn
  2. /
  3. Cursuri
  4. /
  5. Lucrul cu date categoriale în Python

Connected

exercițiu

One-hot encoding pe coloane specifice

Un dealer local de mașini second-hand are nevoie de ajutorul tău pentru a prezice prețul de vânzare al vehiculelor sale. Dacă aplici one-hot encoding pe întregul set de date used_cars, noul set de date va avea peste 1.200 de coloane. Îți faci griji că acest lucru ar putea cauza probleme la antrenarea modelelor de machine learning pentru predicția prețului. Ai decis să încerci o abordare mai simplă și să aplici one-hot encoding doar pe câteva coloane.

Instrucțiuni

100 XP
  • Creează un nou set de date, used_cars_simple, aplicând one-hot encoding pe coloanele: "manufacturer_name" și "transmission" (în această ordine).
  • Setează prefixul tuturor coloanelor noi la "dummy", astfel încât să poți filtra cu ușurință coloanele nou create.