Gesamtbewertung

Denk daran, dass Precision und Recall unterschiedlich gewichtet werden können und daher der F-Beta-Score eine wichtige Bewertungskennzahl ist. Außerdem ist die ROC-AUC-Kurve eine wichtige ergänzende Kennzahl zu Precision und Recall, da du zuvor gesehen hast, dass ein Modell eine hohe AUC, aber eine niedrige Precision haben kann. In dieser Übung berechnest du den vollständigen Satz an Bewertungsmetriken für jeden Klassifikator.

Eine Funktion print_estimator_name() ist gegeben, die den Namen für jeden Klassifikator ausgibt. X_train, y_train, X_test, y_test stehen in deinem Workspace zur Verfügung, und die Features wurden bereits standardisiert. pandas als pd und sklearn stehen dir ebenfalls zur Verfügung.

Diese Übung ist Teil des Kurses

CTR-Vorhersage mit Machine Learning in Python

Anleitung zur Übung

Definiere einen MLP-Klassifikator mit einer verborgenen Schicht mit 10 Neuronen und maximal 50 Iterationen.
Trainiere und sage für jeden Klassifikator voraus.
Verwende Implementierungen aus sklearn, um Precision, Recall, F-Beta-Score und die AUC der ROC zu erhalten.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Create classifiers
clfs = [LogisticRegression(), DecisionTreeClassifier(), RandomForestClassifier(), 
        ____(____ = (10, ), ____ = 50)]

# Produce all evaluation metrics for each classifier
for clf in clfs:
  print("Evaluating classifier: %s" %(print_estimator_name(clf)))
  y_score = clf.fit(X_train, y_train).____(X_test)
  y_pred = clf.fit(X_train, y_train).____(X_test)
  prec = ____(y_test, y_pred, average = 'weighted')
  recall = ____(y_test, y_pred, average = 'weighted')
  fbeta = ____(y_test, y_pred, beta = 0.5, average = 'weighted')
  roc_auc = ____(y_test, y_score[:, 1])
  print("Precision: %s: Recall: %s, F-beta score: %s, AUC of ROC curve: %s" 
        %(prec, recall, fbeta, roc_auc))

Code bearbeiten und ausführen

Diese Übung ist Teil des Kurses

CTR-Vorhersage mit Machine Learning in Python

Mittlere SchwierigkeitSchwierigkeitsgrad

5.0+

Kurs kostenlos starten

Wahrscheinlich bist du auf dieser Seite gelandet, weil du auf einen Link geklickt hast. In diesem Kapitel erfährst du, warum Click-through-Rates (CTR) für zielgerichtete Werbung entscheidend sind, wie du grundlegende DataFrame-Operationen durchführst und wie du Machine-Learning-Modelle zur Vorhersage der CTR einsetzt.

Exercise 1: Einführung in Click-through-Rates Exercise 2: Erste Schritte Exercise 3: Feature-Exploration Exercise 4: Erste Auswertung der Daten Exercise 5: Überblick über Machine-Learning-Modelle Exercise 6: Logistische Regression für Brustkrebs Exercise 7: Logistische Regression für Bilder Exercise 8: Ein zweites Spielzeugmodell Exercise 9: CTR-Vorhersage mit Entscheidungsbäumen Exercise 10: Modellimplementierung Exercise 11: Ein erstes CTR-Modell Exercise 12: Mehr als nur Accuracy

Dieses Kapitel legt die Grundlagen für die explorative Datenanalyse (EDA). Mit Beispieldaten nutzt du die pandas-Bibliothek, um Spalten und Datentypen zu betrachten, fehlende Werte zu untersuchen und mithilfe von Hashing Feature Engineering für kategoriale Features durchzuführen. All das ist wichtig, um Features zu erkunden, die zu einer genaueren CTR-Vorhersage führen.

Exercise 1: Explorative Datenanalyse Exercise 2: Ein erster Blick Exercise 3: Auf fehlende Werte prüfen Exercise 4: Verteilungen nach CTR Exercise 5: Feature Engineering Exercise 6: Datetime-Spalten analysieren Exercise 7: Kategorische Variablen umwandeln Exercise 8: Neue Features erstellen Exercise 9: Features standardisieren Exercise 10: Log-Normalisierung Exercise 11: Standardisierung verstehen Exercise 12: Standardisierung

Jetzt geht es in die Tiefe. Finde heraus, wie du mit Metriken zur Modellleistung wie Precision und Recall reale Fragen beantwortest, zum Beispiel die Bewertung des ROI von Werbeausgaben. Außerdem lernst du Methoden kennen, um diese Kennzahlen zu verbessern, etwa Ensemble-Verfahren und Hyperparameter-Tuning.

Exercise 1: Anwendungen der Metrikbewertung Exercise 2: Vier Ergebnis-Kategorien Exercise 3: Vier Kategorien auswerten Exercise 4: ROI für Werbeausgaben Exercise 5: Modellbewertung Exercise 6: Precision und Recall Exercise 7: Baseline Exercise 8: Klassifikatorvergleich Exercise 9: Modelle tunen Exercise 10: Regularisierung Exercise 11: Kreuzvalidierung Exercise 12: Modellauswahl Exercise 13: Ensembles und Hyperparameter-Tuning Exercise 14: Hyperparameter-Tuning verstehen Exercise 15: Random Forests Exercise 16: Grid Search

Dein Gewinn kann stark von der CTR deiner Kampagne abhängen. In diesem Kapitel lernst du, wie Deep Learning dieses Risiko reduzieren kann. Du konzentrierst dich auf Multi-Layer Perceptron (MLP) und neuronale Netze und erfährst, wie diese die komplexen Beziehungen zwischen Variablen erfassen, um die CTR genauer vorherzusagen. Zum Schluss lernst du, wie du grundlegendes Hyperparameter-Tuning und Regularisierung auf Klassifikationsmodelle anwendest.

Exercise 1: Einführung in Deep Learning Exercise 2: MLPs verstehen Exercise 3: Einstiegsmodell Exercise 4: MLPs für CTR Exercise 5: Hyperparameter-Tuning im Deep Learning Exercise 6: Hyperparameter-Tuning in MLPs Exercise 7: Hyperparameter variieren Exercise 8: MLP-Grid-Search Exercise 9: Modelbewertung Exercise 10: F-Beta-Score Exercise 11: Geringe Precision und hohe AUC Exercise 12: Precision, ROI und AUC Exercise 13: Modellüberprüfung und -vergleich Exercise 14: Aufwärmen: Modellvergleich Exercise 15: Bewertung von Precision und ROI Exercise 16: Gesamtbewertung

Aktuelle Übung

Exercise 17: Abschlussvideo