Stacking toepassen om app-beoordelingen te voorspellen
In deze oefening ga je je eerste Stacking-ensemble bouwen. De gegevensset die je gebruikt is dezelfde als in Hoofdstuk 1. Zoals je je misschien herinnert, is het doel om de beoordeling van elke app te voorspellen (van 1 tot 5). De invoerkenmerken die we gebruiken zijn: Reviews, Size, Installs, Type, Price en Content Rating.
We hebben stap 1: de gegevensset voorbereiden al gedaan. Deze is beschikbaar als apps. We hebben de vereiste kenmerken opgeschoond en ontbrekende waarden vervangen door nullen.
Nu ga je aan de slag met stap 2: de schatters van de eerste laag bouwen.
Deze oefening maakt deel uit van de cursus
Ensemblemethoden in Python
Oefeninstructies
- Bouw en fit een beslissingsboomclassifier met:
min_samples_leaf: 3enmin_samples_split: 9. - Bouw en fit een 5-nearest neighbors-classifier met:
algorithm: 'ball_tree'(om de verwerking te versnellen). - Evalueer de prestaties van elke schatter met de accuracy-score op de testset.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Build and fit a Decision Tree classifier
clf_dt = ____(____, ____, random_state=500)
clf_dt.____
# Build and fit a 5-nearest neighbors classifier using the 'Ball-Tree' algorithm
clf_knn = ____
clf_knn.____
# Evaluate the performance using the accuracy score
print('Decision Tree: {:0.4f}'.format(accuracy_score(____)))
print('5-Nearest Neighbors: {:0.4f}'.format(accuracy_score(____)))