IniziaInizia gratis

Baseline

Valutare un classificatore rispetto a una baseline appropriata è importante. Questo è particolarmente vero per insiemi di dati sbilanciati, come i click sugli annunci, perché un’alta accuratezza può essere ottenuta facilmente prevedendo sempre la classe maggioritaria. In questo esercizio, simulerai un classificatore di baseline che predice sempre la classe maggioritaria (non-click) e osserverai la sua matrice di confusione, oltre ai valori di precision e recall.

X_train, y_train, X_test, y_test sono disponibili nel tuo workspace. pandas come pd, numpy come np e sklearn sono anch’essi disponibili nel tuo workspace.

Questo esercizio fa parte del corso

Prevedere il CTR con il Machine Learning in Python

Visualizza il corso

Istruzioni dell'esercizio

  • Crea y_pred, un array di zeri con la stessa lunghezza di X_test, usando np.asarray().
  • Stampa la matrice di confusione risultante.
  • Ottieni i punteggi di precision e recall.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Set up baseline predictions
y_pred = np.____([0 for x in range(len(X_test))])

# Look at confusion matrix
print("Confusion matrix: ")
print(____(y_test, y_pred))

# Check precision and recall
prec = ____(y_test, y_pred, average = 'weighted')
recall = ____(y_test, y_pred, average = 'weighted')
print("Precision: %s, Recall: %s" %(prec, recall))
Modifica ed esegui il codice