Stacking anwenden, um App-Bewertungen vorherzusagen

In dieser Übung baust du dein erstes Stacking-Ensemble. Der Datensatz ist derselbe wie in Kapitel 1. Zur Erinnerung: Das Ziel ist, die Bewertung jeder App (von 1 bis 5) vorherzusagen. Als Eingabemerkmale verwenden wir: Reviews, Size, Installs, Type, Price und Content Rating.

Wir haben bereits Schritt 1: den Datensatz vorbereiten erledigt. Er steht dir als apps zur Verfügung. Wir haben die benötigten Merkmale bereinigt und fehlende Werte durch Nullen ersetzt.

Jetzt arbeitest du an Schritt 2: die Schätzer der ersten Ebene bauen.

Diese Übung ist Teil des Kurses

<Kurs>Ensemble-Methoden in Python</Kurs>

Kurs ansehen

Übungsanweisungen

Erstelle und fitte einen Decision-Tree-Classifier mit: min_samples_leaf: 3 und min_samples_split: 9.
Erstelle und fitte einen 5-Nearest-Neighbors-Classifier mit: algorithm: 'ball_tree' (um die Verarbeitung zu beschleunigen).
Bewerte die Leistung jedes Schätzers mit der Accuracy auf dem Testset.

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Build and fit a Decision Tree classifier
clf_dt = ____(____, ____, random_state=500)
clf_dt.____

# Build and fit a 5-nearest neighbors classifier using the 'Ball-Tree' algorithm
clf_knn = ____
clf_knn.____

# Evaluate the performance using the accuracy score
print('Decision Tree: {:0.4f}'.format(accuracy_score(____)))
print('5-Nearest Neighbors: {:0.4f}'.format(accuracy_score(____)))

Code bearbeiten und ausführen