Precision e recall

Sia la precision sia il recall sono collegati ai quattro esiti discussi nella lezione precedente e sono metriche di valutazione fondamentali per qualsiasi modello di machine learning. Un modello di CTR pubblicitario dovrebbe idealmente avere alta precision (alto ROI sulla spesa pubblicitaria) e alto recall (targeting di pubblico rilevante). Anche se è possibile calcolare precision e recall a mano, sklearn offre comode implementazioni che puoi integrare facilmente nel flusso di lavoro. In questo esercizio imposterai un albero decisionale e calcolerai precision e recall.

Il modulo pandas è disponibile come pd nel tuo ambiente di lavoro e il DataFrame di esempio è caricato come df. Le feature sono caricate in X e il target è caricato in y per l'uso. Inoltre, precision_score() e recall_score() da sklearn.metrics sono disponibili.

Questo esercizio fa parte del corso

Prevedere il CTR con il Machine Learning in Python

Visualizza corso

Istruzioni dell'esercizio

Ottieni le suddivisioni di training e test per X e y.
Definisci un classificatore ad albero decisionale e produci le predizioni y_pred addestrando il modello.
Usa le implementazioni di sklearn per ottenere i punteggi di precision e recall.

esercizio interattivo pratico

Prova questo esercizio completando questo codice di esempio.

# Set up training and testing split
X_train, X_test, y_train, y_test = ____(
  ____, ____, test_size = .2, random_state = 0)

# Create classifier and make predictions
clf = ____
y_pred = clf.____(____, _____).____(X_test) 

# Evaluate precision and recall
prec = ____(y_test, ____, average = 'weighted')
recall = ____(y_test, ____, average = 'weighted')
print("Precision: %s, Recall: %s" %(prec, recall))

Modifica ed esegui il codice

Questo esercizio fa parte del corso

Prevedere il CTR con il Machine Learning in Python

IntermediárioNível de habilidade

4.9+

Inizia il corso gratuitamente

Con tutta probabilità sei su questa pagina perché hai cliccato un link. In questo capitolo scoprirai perché i click-through rate (CTR) sono fondamentali per la pubblicità mirata, come eseguire semplici manipolazioni di DataFrame e come usare modelli di Machine Learning per prevedere il CTR.

Exercise 1: Introduzione ai click-through rate Exercise 2: Primi passi Exercise 3: Esplorazione delle feature Exercise 4: Prima valutazione dei dati Exercise 5: Panoramica dei modelli di Machine Learning Exercise 6: Regressione logistica per il tumore al seno Exercise 7: Regressione logistica per immagini Exercise 8: Un secondo modello di prova Exercise 9: Previsione del CTR con alberi decisionali Exercise 10: Implementazione del modello Exercise 11: Un primo modello di CTR Exercise 12: Oltre la sola accuratezza

Questo capitolo fornisce le basi per l’analisi esplorativa dei dati (EDA). Con dati di esempio userai la libreria pandas per esaminare colonne e tipi di dato, esplorare i valori mancanti e utilizzare l’hashing per fare feature engineering su variabili categoriche. Tutto ciò è importante quando si analizzano le feature per prevedere il CTR in modo più accurato.

Exercise 1: Analisi esplorativa dei dati Exercise 2: Un primo sguardo Exercise 3: Verificare i valori mancanti Exercise 4: Distribuzioni per CTR Exercise 5: Feature engineering Exercise 6: Analizzare le colonne datetime Exercise 7: Conversione delle variabili categoriche Exercise 8: Creare nuove feature Exercise 9: Standardizzare le feature Exercise 10: Normalizzazione logaritmica Exercise 11: Capire la standardizzazione Exercise 12: Standard scaling

È il momento di andare più a fondo. Scoprirai come usare misure di performance del modello, tra cui precision e recall, per rispondere a domande reali, come valutare l’ROI della spesa pubblicitaria. Imparerai anche come migliorare queste metriche di valutazione, ad esempio con metodi ensemble e la regolazione degli iperparametri.

Exercise 1: Applicazioni della valutazione delle metriche Exercise 2: Quattro categorie di esiti Exercise 3: Valutare quattro categorie Exercise 4: ROI sulla spesa pubblicitaria Exercise 5: Valutazione del modello Exercise 6: Precision e recall

Esercizio attuale

Exercise 7: Baseline Exercise 8: Confronto tra classificatori Exercise 9: Ottimizzazione dei modelli Exercise 10: Regolarizzazione Exercise 11: Cross validation Exercise 12: Selezione del modello Exercise 13: Ensemble e ottimizzazione degli iperparametri Exercise 14: Capire l’hyperparameter tuning Exercise 15: Random forest Exercise 16: Grid search

I profitti possono essere fortemente influenzati dal CTR della tua campagna. In questo capitolo imparerai come il deep learning può aiutare a ridurre quel rischio. Ti concentrerai su multilayer perceptron (MLP) e modelli di rete neurale, e vedrai come possano catturare relazioni complesse tra variabili per prevedere il CTR con maggiore precisione. Infine, esplorerai come applicare le basi dell’hyperparameter tuning e della regolarizzazione ai modelli di classificazione.

Exercise 1: Introduzione al deep learning Exercise 2: Capire gli MLP Exercise 3: Modello iniziale Exercise 4: MLP per il CTR Exercise 5: Ottimizzazione degli iperparametri nel deep learning Exercise 6: Ottimizzazione degli iperparametri negli MLP Exercise 7: Variare gli iperparametri Exercise 8: Grid search per MLP Exercise 9: Valutazione del modello Exercise 10: Punteggio F-beta Exercise 11: Bassa precision e AUC alta Exercise 12: Precision, ROI e AUC Exercise 13: Revisione e confronto dei modelli Exercise 14: Riscaldamento al confronto tra modelli Exercise 15: Valutare precision e ROI Exercise 16: Valutazione completa Exercise 17: Video di riepilogo