IniziaInizia gratis

Precision e recall

Sia la precision sia il recall sono collegati ai quattro esiti discussi nella lezione precedente e sono metriche di valutazione fondamentali per qualsiasi modello di machine learning. Un modello di CTR pubblicitario dovrebbe idealmente avere alta precision (alto ROI sulla spesa pubblicitaria) e alto recall (targeting di pubblico rilevante). Anche se è possibile calcolare precision e recall a mano, sklearn offre comode implementazioni che puoi integrare facilmente nel flusso di lavoro. In questo esercizio imposterai un albero decisionale e calcolerai precision e recall.

Il modulo pandas è disponibile come pd nel tuo ambiente di lavoro e il DataFrame di esempio è caricato come df. Le feature sono caricate in X e il target è caricato in y per l'uso. Inoltre, precision_score() e recall_score() da sklearn.metrics sono disponibili.

Questo esercizio fa parte del corso

Prevedere il CTR con il Machine Learning in Python

Visualizza il corso

Istruzioni dell'esercizio

  • Ottieni le suddivisioni di training e test per X e y.
  • Definisci un classificatore ad albero decisionale e produci le predizioni y_pred addestrando il modello.
  • Usa le implementazioni di sklearn per ottenere i punteggi di precision e recall.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Set up training and testing split
X_train, X_test, y_train, y_test = ____(
  ____, ____, test_size = .2, random_state = 0)

# Create classifier and make predictions
clf = ____
y_pred = clf.____(____, _____).____(X_test) 

# Evaluate precision and recall
prec = ____(y_test, ____, average = 'weighted')
recall = ____(y_test, ____, average = 'weighted')
print("Precision: %s, Recall: %s" %(prec, recall))
Modifica ed esegui il codice