Baseline
Einen Klassifikator im Vergleich zu einer geeigneten Baseline zu bewerten, ist wichtig. Das gilt besonders für unausgewogene Datensätze wie Ad-Klicks, weil man durch das ständige Wählen der Mehrheitsklasse leicht eine hohe Accuracy erreicht. In dieser Übung simulierst du einen Baseline-Klassifikator, der immer die Mehrheitsklasse (kein Klick) vorhersagt, und betrachtest seine Confusion-Matrix sowie seine Precision- und Recall-Werte.
X_train, y_train, X_test, y_test stehen dir in deinem Workspace zur Verfügung. pandas als pd, numpy als np und sklearn sind ebenfalls verfügbar.
Diese Übung ist Teil des Kurses
CTR-Vorhersage mit Machine Learning in Python
Anleitung zur Übung
- Erstelle
y_pred, ein Array aus Nullen mit derselben Länge wieX_test, mithilfe vonnp.asarray(). - Gib die resultierende Confusion-Matrix aus.
- Ermittle die Precision- und Recall-Werte.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Set up baseline predictions
y_pred = np.____([0 for x in range(len(X_test))])
# Look at confusion matrix
print("Confusion matrix: ")
print(____(y_test, y_pred))
# Check precision and recall
prec = ____(y_test, y_pred, average = 'weighted')
recall = ____(y_test, y_pred, average = 'weighted')
print("Precision: %s, Recall: %s" %(prec, recall))