Precision e recall
Sia la precision sia il recall sono collegati ai quattro esiti discussi nella lezione precedente e sono metriche di valutazione fondamentali per qualsiasi modello di machine learning. Un modello di CTR pubblicitario dovrebbe idealmente avere alta precision (alto ROI sulla spesa pubblicitaria) e alto recall (targeting di pubblico rilevante). Anche se è possibile calcolare precision e recall a mano, sklearn offre comode implementazioni che puoi integrare facilmente nel flusso di lavoro. In questo esercizio imposterai un albero decisionale e calcolerai precision e recall.
Il modulo pandas è disponibile come pd nel tuo ambiente di lavoro e il DataFrame di esempio è caricato come df. Le feature sono caricate in X e il target è caricato in y per l'uso. Inoltre, precision_score() e recall_score() da sklearn.metrics sono disponibili.
Questo esercizio fa parte del corso
Prevedere il CTR con il Machine Learning in Python
Istruzioni dell'esercizio
- Ottieni le suddivisioni di training e test per
Xey. - Definisci un classificatore ad albero decisionale e produci le predizioni
y_predaddestrando il modello. - Usa le implementazioni di
sklearnper ottenere i punteggi di precision e recall.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Set up training and testing split
X_train, X_test, y_train, y_test = ____(
____, ____, test_size = .2, random_state = 0)
# Create classifier and make predictions
clf = ____
y_pred = clf.____(____, _____).____(X_test)
# Evaluate precision and recall
prec = ____(y_test, ____, average = 'weighted')
recall = ____(y_test, ____, average = 'weighted')
print("Precision: %s, Recall: %s" %(prec, recall))