Stacking anwenden, um App-Bewertungen vorherzusagen
In dieser Übung baust du dein erstes Stacking-Ensemble. Der Datensatz ist derselbe wie in Kapitel 1. Zur Erinnerung: Das Ziel ist, die Bewertung jeder App (von 1 bis 5) vorherzusagen. Als Eingabemerkmale verwenden wir: Reviews, Size, Installs, Type, Price und Content Rating.
Wir haben bereits Schritt 1: den Datensatz vorbereiten erledigt. Er steht dir als apps zur Verfügung. Wir haben die benötigten Merkmale bereinigt und fehlende Werte durch Nullen ersetzt.
Jetzt arbeitest du an Schritt 2: die Schätzer der ersten Ebene bauen.
Diese Übung ist Teil des Kurses
Ensemble-Methoden in Python
Anleitung zur Übung
- Erstelle und fitte einen Decision-Tree-Classifier mit:
min_samples_leaf: 3undmin_samples_split: 9. - Erstelle und fitte einen 5-Nearest-Neighbors-Classifier mit:
algorithm: 'ball_tree'(um die Verarbeitung zu beschleunigen). - Bewerte die Leistung jedes Schätzers mit der Accuracy auf dem Testset.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Build and fit a Decision Tree classifier
clf_dt = ____(____, ____, random_state=500)
clf_dt.____
# Build and fit a 5-nearest neighbors classifier using the 'Ball-Tree' algorithm
clf_knn = ____
clf_knn.____
# Evaluate the performance using the accuracy score
print('Decision Tree: {:0.4f}'.format(accuracy_score(____)))
print('5-Nearest Neighbors: {:0.4f}'.format(accuracy_score(____)))