Categorieën encoderen
Je moet je algoritme helpen begrijpen dat je met categorieën werkt. Je gaat de categorieën van de variabele salary encoderen, waarvan je weet dat die ordinaal is op basis van de waarden die je hebt gezien:
- je moet eerst aan Python aangeven dat de kolom
salaryeigenlijk categorisch is - vervolgens geef je de juiste volgorde van de categorieën op
- tot slot codeer je elke categorie met een numerieke waarde die overeenkomt met de positie in die volgorde
Deze oefening maakt deel uit van de cursus
HR-analytics: verloop van medewerkers voorspellen in Python
Interactieve oefening met praktijkervaring
Probeer deze oefening door deze voorbeeldcode aan te vullen.
# Change the type of the "salary" column to categorical
data.salary = data.salary.____('category')