Esplorare i dati UCI SECOM

Per concludere questo capitolo e consolidare la comprensione del bagging, è il momento di lavorare con un nuovo insieme di dati! Questi dati provengono da un processo di produzione di semiconduttori, ottenuti dall’UCI Machine Learning Repository.

Ogni riga rappresenta un’entità di produzione. Le feature sono misurazioni provenienti da sensori o punti del processo. Le etichette indicano se l’entità supera (1) o non supera (-1) il test.

Il dataset è stato caricato ed è disponibile come uci_secom. La variabile target è la colonna 'Pass/Fail'. Usa i metodi .value_counts() e .describe() per analizzare questa variabile. Che cosa noti?

Questo esercizio fa parte del corso

Metodi Ensemble in Python

Visualizza corso

esercizio interattivo pratico

Trasforma la teoria in pratica con uno dei nostri esercizi interattivi

Inizia esercizio