Die Bewertung einer App vorhersagen

Nachdem du den Google-Apps-Datensatz in der vorherigen Übung untersucht hast, bauen wir jetzt ein Modell, das die Bewertung einer App anhand einer Auswahl ihrer Merkmale vorhersagt.

Dazu verwendest du den DecisionTreeRegressor aus scikit-learn. Da Entscheidungsbäume die Bausteine vieler Ensemble-Modelle sind, lohnt es sich, dein Wissen über ihre Funktionsweise aufzufrischen – das wird dir im gesamten Kurs helfen.

Wir verwenden die MAE (Mean Absolute Error) als Bewertungsmetrik. Diese Metrik ist sehr gut interpretierbar, da sie den durchschnittlichen absoluten Unterschied zwischen tatsächlichen und vorhergesagten Bewertungen angibt.

Alle benötigten Module wurden bereits für dich importiert. Features und Zielvariable stehen dir in den Variablen X bzw. y zur Verfügung.

Diese Übung ist Teil des Kurses

Ensemble-Methoden in Python

Kurs anzeigen

Anleitung zur Übung

Verwende train_test_split(), um X und y in Trainings- und Testsets zu teilen. Nutze 20 % bzw. 0.2 als Testgröße.
Instanziiere einen DecisionTreeRegressor(), reg_dt, mit folgenden Hyperparametern: min_samples_leaf = 3 und min_samples_split = 9.
Fitte den Regressor mit .fit() auf das Trainingsset.
Sage die Labels des Testsets mit .predict() voraus.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Split into train (80%) and test (20%) sets
X_train, X_test, y_train, y_test = ____(____, ____, ____, random_state=42)

# Instantiate the regressor
reg_dt = ____(____, ____, random_state=500)

# Fit to the training set
____

# Evaluate the performance of the model on the test set
y_pred = ____
print('MAE: {:.3f}'.format(mean_absolute_error(y_test, y_pred)))

Code bearbeiten und ausführen