Baseline
Valutare un classificatore rispetto a una baseline appropriata è importante. Questo è particolarmente vero per insiemi di dati sbilanciati, come i click sugli annunci, perché un’alta accuratezza può essere ottenuta facilmente prevedendo sempre la classe maggioritaria. In questo esercizio, simulerai un classificatore di baseline che predice sempre la classe maggioritaria (non-click) e osserverai la sua matrice di confusione, oltre ai valori di precision e recall.
X_train, y_train, X_test, y_test sono disponibili nel tuo workspace. pandas come pd, numpy come np e sklearn sono anch’essi disponibili nel tuo workspace.
Questo esercizio fa parte del corso
Prevedere il CTR con il Machine Learning in Python
Istruzioni dell'esercizio
- Crea
y_pred, un array di zeri con la stessa lunghezza diX_test, usandonp.asarray(). - Stampa la matrice di confusione risultante.
- Ottieni i punteggi di precision e recall.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Set up baseline predictions
y_pred = np.____([0 for x in range(len(X_test))])
# Look at confusion matrix
print("Confusion matrix: ")
print(____(y_test, y_pred))
# Check precision and recall
prec = ____(y_test, y_pred, average = 'weighted')
recall = ____(y_test, y_pred, average = 'weighted')
print("Precision: %s, Recall: %s" %(prec, recall))