LoslegenKostenlos loslegen

Regularisierung

Regularisierung bedeutet, einem Modell zusätzliche Informationen hinzuzufügen, um Overfitting zu verhindern. Das ist wichtig, um die Bewertungsmetriken zu verbessern, die du zuvor in diesem Kapitel gesehen hast. In dieser Übung variierst du den Parameter für die maximale Tiefe eines Entscheidungsbaums, um zu sehen, wie sich die Klassifikationsergebnisse ändern.

X_train, y_train, X_test, y_test stehen dir in deinem Workspace zur Verfügung. pandas als pd, numpy als np und sklearn sind ebenfalls verfügbar. Zusätzlich stehen dir confusion_matrix(), precision_score() und recall_score() aus sklearn.metrics zur Verfügung.

Diese Übung ist Teil des Kurses

CTR-Vorhersage mit Machine Learning in Python

Kurs anzeigen

Anleitung zur Übung

  • Erstelle verschiedene Entscheidungsbäume, indem du die maximale Tiefe jedes Baums variierst.
  • Fitte jeden Baum und erstelle Vorhersagen auf den Testdaten.
  • Werte für jeden Baum die Confusion Matrix, Precision und Recall aus.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Iterate over different levels of max depth
for max_depth_val in [2, 3, 5, 10, 15, 20]:
  # Create and fit model
  clf = ____(____ = max_depth_val)
  print("Evaluating tree with max_depth = %s" %(max_depth_val))
  y_pred = clf.fit(____, ____).predict(____) 
  
  # Evaluate confusion matrix, precision, recall
  print("Confusion matrix: ")
  print(____(y_test, y_pred))
  prec = ____(____, ____, average = 'weighted')
  recall = ____(____, ____, average = 'weighted')
  print("Precision: %s, Recall: %s" %(prec, recall))
Code bearbeiten und ausführen