Explorando os dados UCI SECOM
Para fechar este capítulo e consolidar seu entendimento sobre bagging, é hora de trabalhar com um novo conjunto de dados! Esses dados vêm de um processo de fabricação de semicondutores, obtidos do UCI Machine Learning Repository.
Cada linha representa uma unidade de produção. As variáveis são medições de sensores ou pontos do processo. Os rótulos indicam se a unidade passa (1) ou falha (-1) no teste.
O conjunto de dados já está carregado e disponível como uci_secom. A variável target é a coluna 'Pass/Fail'. Use os métodos .value_counts() e .describe() para verificar essa variável. O que você observa?
Este exercício faz parte do curso
Métodos de Ensemble em Python
Exercício interativo prático
Transforme a teoria em ação com um de nossos exercícios interativos
Começar o exercício