Feature-importance berekenen met random forests
Als data scientist bij een financieel adviesbureau heb je een random forest-classifier ontwikkeld die personen indeelt op basis van hun inkomensniveau. Nu moet je het model uitleggen door de feature-importance te analyseren, zodat je de belangrijkste factoren voor het voorspellen van inkomen kunt bepalen. Dat maakt gerichtere marktsegmentatie mogelijk en verbetert strategische besluitvorming.
matplotlib.pyplot is geïmporteerd als plt. X_train en y_train zijn al voor je geladen.
Deze oefening maakt deel uit van de cursus
Explainable AI in Python
Oefeninstructies
- Haal de feature-importance op uit het
model. - Plot de
feature_importances.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
model = RandomForestClassifier(random_state=42)
model.fit(X_train, y_train)
# Derive feature importances
feature_importances = ____
# Plot the feature importances
____
plt.show()