LoslegenKostenlos loslegen

Baseline

Einen Klassifikator im Vergleich zu einer geeigneten Baseline zu bewerten, ist wichtig. Das gilt besonders für unausgewogene Datensätze wie Ad-Klicks, weil man durch das ständige Wählen der Mehrheitsklasse leicht eine hohe Accuracy erreicht. In dieser Übung simulierst du einen Baseline-Klassifikator, der immer die Mehrheitsklasse (kein Klick) vorhersagt, und betrachtest seine Confusion-Matrix sowie seine Precision- und Recall-Werte.

X_train, y_train, X_test, y_test stehen dir in deinem Workspace zur Verfügung. pandas als pd, numpy als np und sklearn sind ebenfalls verfügbar.

Diese Übung ist Teil des Kurses

CTR-Vorhersage mit Machine Learning in Python

Kurs anzeigen

Anleitung zur Übung

  • Erstelle y_pred, ein Array aus Nullen mit derselben Länge wie X_test, mithilfe von np.asarray().
  • Gib die resultierende Confusion-Matrix aus.
  • Ermittle die Precision- und Recall-Werte.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Set up baseline predictions
y_pred = np.____([0 for x in range(len(X_test))])

# Look at confusion matrix
print("Confusion matrix: ")
print(____(y_test, y_pred))

# Check precision and recall
prec = ____(y_test, y_pred, average = 'weighted')
recall = ____(y_test, y_pred, average = 'weighted')
print("Precision: %s, Recall: %s" %(prec, recall))
Code bearbeiten und ausführen