Entropie vs. Gini-index
In deze oefening vergelijk je de testset-nauwkeurigheid van dt_entropy met die van een andere boom, dt_gini. De boom dt_gini is getraind op dezelfde gegevensset met dezelfde parameters, behalve het informatiecriterium, dat is ingesteld op de Gini-index met het sleutelwoord 'gini'.
X_test, y_test, dt_entropy en accuracy_gini (de testset-nauwkeurigheid behaald door dt_gini) zijn beschikbaar in je werkruimte.
Deze oefening maakt deel uit van de cursus
Machine Learning met boomgebaseerde modellen in Python
Oefeninstructies
- Importeer
accuracy_scoreuitsklearn.metrics. - Voorspel de testset-labels van
dt_entropyen sla het resultaat op iny_pred. - Evalueer de testset-nauwkeurigheid van
dt_entropyen sla het resultaat op inaccuracy_entropy. - Bekijk
accuracy_entropyenaccuracy_gini.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Import accuracy_score from sklearn.metrics
from ____.____ import ____
# Use dt_entropy to predict test set labels
____= ____.____(____)
# Evaluate accuracy_entropy
accuracy_entropy = ____(____, ____)
# Print accuracy_entropy
print(f'Accuracy achieved by using entropy: {accuracy_entropy:.3f}')
# Print accuracy_gini
print(f'Accuracy achieved by using the gini index: {accuracy_gini:.3f}')