Aan de slagGa gratis aan de slag

Stacking toepassen om app-beoordelingen te voorspellen

In deze oefening ga je je eerste Stacking-ensemble bouwen. De gegevensset die je gebruikt is dezelfde als in Hoofdstuk 1. Zoals je je misschien herinnert, is het doel om de beoordeling van elke app te voorspellen (van 1 tot 5). De invoerkenmerken die we gebruiken zijn: Reviews, Size, Installs, Type, Price en Content Rating.

We hebben stap 1: de gegevensset voorbereiden al gedaan. Deze is beschikbaar als apps. We hebben de vereiste kenmerken opgeschoond en ontbrekende waarden vervangen door nullen.

Nu ga je aan de slag met stap 2: de schatters van de eerste laag bouwen.

Deze oefening maakt deel uit van de cursus

Ensemblemethoden in Python

Cursus bekijken

Oefeninstructies

  • Bouw en fit een beslissingsboomclassifier met: min_samples_leaf: 3 en min_samples_split: 9.
  • Bouw en fit een 5-nearest neighbors-classifier met: algorithm: 'ball_tree' (om de verwerking te versnellen).
  • Evalueer de prestaties van elke schatter met de accuracy-score op de testset.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Build and fit a Decision Tree classifier
clf_dt = ____(____, ____, random_state=500)
clf_dt.____

# Build and fit a 5-nearest neighbors classifier using the 'Ball-Tree' algorithm
clf_knn = ____
clf_knn.____

# Evaluate the performance using the accuracy score
print('Decision Tree: {:0.4f}'.format(accuracy_score(____)))
print('5-Nearest Neighbors: {:0.4f}'.format(accuracy_score(____)))
Code bewerken en uitvoeren