Regolarizzazione

La regolarizzazione è il processo di aggiungere informazioni a un modello per prevenire l’overfitting. Questo è importante per migliorare le metriche di valutazione viste prima nel capitolo. In questo esercizio, varierai il parametro di profondità massima di un albero decisionale per vedere come cambiano i risultati di classificazione.

X_train, y_train, X_test, y_test sono disponibili nel tuo workspace. pandas come pd, numpy come np e sklearn sono anch’essi disponibili nel tuo workspace. Inoltre, confusion_matrix(), precision_score() e recall_score() da sklearn.metrics sono disponibili.

Questo esercizio fa parte del corso

Prevedere il CTR con il Machine Learning in Python

Visualizza corso

Istruzioni dell'esercizio

Crea alberi decisionali diversi variando la profondità massima di ciascun albero.
Per ogni albero, fai il fit e genera le predizioni sui dati di test.
Valuta la matrice di confusione, la precision e la recall per ogni albero.

esercizio interattivo pratico

Prova questo esercizio completando questo codice di esempio.

# Iterate over different levels of max depth
for max_depth_val in [2, 3, 5, 10, 15, 20]:
  # Create and fit model
  clf = ____(____ = max_depth_val)
  print("Evaluating tree with max_depth = %s" %(max_depth_val))
  y_pred = clf.fit(____, ____).predict(____) 
  
  # Evaluate confusion matrix, precision, recall
  print("Confusion matrix: ")
  print(____(y_test, y_pred))
  prec = ____(____, ____, average = 'weighted')
  recall = ____(____, ____, average = 'weighted')
  print("Precision: %s, Recall: %s" %(prec, recall))

Modifica ed esegui il codice

Questo esercizio fa parte del corso

Prevedere il CTR con il Machine Learning in Python

IntermediárioNível de habilidade

4.9+

Inizia il corso gratuitamente

Con tutta probabilità sei su questa pagina perché hai cliccato un link. In questo capitolo scoprirai perché i click-through rate (CTR) sono fondamentali per la pubblicità mirata, come eseguire semplici manipolazioni di DataFrame e come usare modelli di Machine Learning per prevedere il CTR.

Exercise 1: Introduzione ai click-through rate Exercise 2: Primi passi Exercise 3: Esplorazione delle feature Exercise 4: Prima valutazione dei dati Exercise 5: Panoramica dei modelli di Machine Learning Exercise 6: Regressione logistica per il tumore al seno Exercise 7: Regressione logistica per immagini Exercise 8: Un secondo modello di prova Exercise 9: Previsione del CTR con alberi decisionali Exercise 10: Implementazione del modello Exercise 11: Un primo modello di CTR Exercise 12: Oltre la sola accuratezza

Questo capitolo fornisce le basi per l’analisi esplorativa dei dati (EDA). Con dati di esempio userai la libreria pandas per esaminare colonne e tipi di dato, esplorare i valori mancanti e utilizzare l’hashing per fare feature engineering su variabili categoriche. Tutto ciò è importante quando si analizzano le feature per prevedere il CTR in modo più accurato.

Exercise 1: Analisi esplorativa dei dati Exercise 2: Un primo sguardo Exercise 3: Verificare i valori mancanti Exercise 4: Distribuzioni per CTR Exercise 5: Feature engineering Exercise 6: Analizzare le colonne datetime Exercise 7: Conversione delle variabili categoriche Exercise 8: Creare nuove feature Exercise 9: Standardizzare le feature Exercise 10: Normalizzazione logaritmica Exercise 11: Capire la standardizzazione Exercise 12: Standard scaling

È il momento di andare più a fondo. Scoprirai come usare misure di performance del modello, tra cui precision e recall, per rispondere a domande reali, come valutare l’ROI della spesa pubblicitaria. Imparerai anche come migliorare queste metriche di valutazione, ad esempio con metodi ensemble e la regolazione degli iperparametri.

Exercise 1: Applicazioni della valutazione delle metriche Exercise 2: Quattro categorie di esiti Exercise 3: Valutare quattro categorie Exercise 4: ROI sulla spesa pubblicitaria Exercise 5: Valutazione del modello Exercise 6: Precision e recall Exercise 7: Baseline Exercise 8: Confronto tra classificatori Exercise 9: Ottimizzazione dei modelli Exercise 10: Regolarizzazione

Esercizio attuale

Exercise 11: Cross validation Exercise 12: Selezione del modello Exercise 13: Ensemble e ottimizzazione degli iperparametri Exercise 14: Capire l’hyperparameter tuning Exercise 15: Random forest Exercise 16: Grid search

I profitti possono essere fortemente influenzati dal CTR della tua campagna. In questo capitolo imparerai come il deep learning può aiutare a ridurre quel rischio. Ti concentrerai su multilayer perceptron (MLP) e modelli di rete neurale, e vedrai come possano catturare relazioni complesse tra variabili per prevedere il CTR con maggiore precisione. Infine, esplorerai come applicare le basi dell’hyperparameter tuning e della regolarizzazione ai modelli di classificazione.

Exercise 1: Introduzione al deep learning Exercise 2: Capire gli MLP Exercise 3: Modello iniziale Exercise 4: MLP per il CTR Exercise 5: Ottimizzazione degli iperparametri nel deep learning Exercise 6: Ottimizzazione degli iperparametri negli MLP Exercise 7: Variare gli iperparametri Exercise 8: Grid search per MLP Exercise 9: Valutazione del modello Exercise 10: Punteggio F-beta Exercise 11: Bassa precision e AUC alta Exercise 12: Precision, ROI e AUC Exercise 13: Revisione e confronto dei modelli Exercise 14: Riscaldamento al confronto tra modelli Exercise 15: Valutare precision e ROI Exercise 16: Valutazione completa Exercise 17: Video di riepilogo