Information Value berekenen
Tot nu toe heb je gegevens uit meerdere bronnen gecombineerd en nieuwe variabelen gemaakt om inzichten uit data te halen. Denk je dat al deze variabelen verloop kunnen verklaren?
Information Value (IV) helpt bij het meten en rangschikken van variabelen op basis van de voorspellende kracht van elke variabele. Je kunt Information Value (IV) gebruiken om variabelen met een zeer lage voorspellende kracht te verwijderen.
Deze oefening maakt deel uit van de cursus
HR-analytics: verloop van medewerkers voorspellen in R
Oefeninstructies
- Laad het
Information-pakket. - Gebruik de
emp_final-gegevensset uit de vorige oefening om de information value van alle variabelen in de gegevensset te vinden. - Print de Information Value (IV) van elke variabele.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Load Information package
___
# Compute Information Value
IV <- create_infotables(data = ___, y = ___)
# Print Information Value
___