Explorando os dados UCI SECOM
Para fechar este capítulo e consolidar seu entendimento sobre bagging, é hora de trabalhar com um novo conjunto de dados! Esses dados vêm de um processo de fabricação de semicondutores, obtidos do UCI Machine Learning Repository.
Cada linha representa uma unidade de produção. As variáveis são medições de sensores ou pontos do processo. Os rótulos indicam se a unidade passa (1) ou falha (-1) no teste.
O conjunto de dados já está carregado e disponível como uci_secom. A variável target é a coluna 'Pass/Fail'. Use os métodos .value_counts() e .describe() para verificar essa variável. O que você observa?
Este exercicio faz parte do curso
Métodos de Ensemble em Python
exercicio interativo prático
Transforme teoria em prática com um dos nossos exercicio interativos
Iniciar exercicio