Esplorare i dati UCI SECOM
Per concludere questo capitolo e consolidare la comprensione del bagging, è il momento di lavorare con un nuovo insieme di dati! Questi dati provengono da un processo di produzione di semiconduttori, ottenuti dall’UCI Machine Learning Repository.
Ogni riga rappresenta un’entità di produzione. Le feature sono misurazioni provenienti da sensori o punti del processo. Le etichette indicano se l’entità supera (1) o non supera (-1) il test.
Il dataset è stato caricato ed è disponibile come uci_secom. La variabile target è la colonna 'Pass/Fail'. Usa i metodi .value_counts() e .describe() per analizzare questa variabile. Che cosa noti?
Questo esercizio fa parte del corso
Metodi Ensemble in Python
Esercizio pratico interattivo
Passa dalla teoria alla pratica con uno dei nostri esercizi interattivi
Inizia esercizio