ComeçarComece de graça

Explorando os dados UCI SECOM

Para fechar este capítulo e consolidar seu entendimento sobre bagging, é hora de trabalhar com um novo conjunto de dados! Esses dados vêm de um processo de fabricação de semicondutores, obtidos do UCI Machine Learning Repository.

Cada linha representa uma unidade de produção. As variáveis são medições de sensores ou pontos do processo. Os rótulos indicam se a unidade passa (1) ou falha (-1) no teste.

O conjunto de dados já está carregado e disponível como uci_secom. A variável target é a coluna 'Pass/Fail'. Use os métodos .value_counts() e .describe() para verificar essa variável. O que você observa?

Este exercício faz parte do curso

Métodos de Ensemble em Python

Ver curso

Exercício interativo prático

Transforme a teoria em ação com um de nossos exercícios interativos

Começar o exercício