Categorieën encoderen
Je moet je algoritme helpen begrijpen dat je met categorieën werkt. Je gaat de categorieën van de variabele salary encoderen, waarvan je weet dat die ordinaal is op basis van de waarden die je hebt gezien:
- je moet eerst aan Python aangeven dat de kolom
salaryeigenlijk categorisch is - vervolgens geef je de juiste volgorde van de categorieën op
- tot slot codeer je elke categorie met een numerieke waarde die overeenkomt met de positie in die volgorde
Deze oefening maakt deel uit van de cursus
HR-analytics: verloop van medewerkers voorspellen in Python
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Change the type of the "salary" column to categorical
data.salary = data.salary.____('category')