De boom exporteren
Bij Decision Tree-classificatietaken is overfitting meestal het gevolg van te diep gegroeide bomen. Zoals de vergelijking van de nauwkeurigheidsscores op de train- en testsets laat zien, heb je in je resultaten last van overfitting. Dit kun je ook afleiden uit de boomvisualisatie.
In deze oefening exporteer je de decision tree naar een tekstdocument, dat je vervolgens kunt gebruiken voor visualisatie.
Deze oefening maakt deel uit van de cursus
HR-analytics: verloop van medewerkers voorspellen in Python
Oefeninstructies
- Importeer de functie
export_graphviz()uit de submodulesklearn.tree. - Train het
modelop de trainingsdata. - Exporteer de visualisatie naar het bestand
tree.dot.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Import the graphical visualization export function
from sklearn.____ import export_graphviz
# Apply Decision Tree model to fit Features to the Target
model.____(features_train,target_train)
# Export the tree to a dot file
____(model,"tree.____")