Explorer les données UCI SECOM
Pour conclure ce chapitre et consolider votre compréhension du bagging, il est temps de travailler avec un nouveau jeu de données ! Ces données proviennent d’un processus de fabrication de semi-conducteurs, issues du UCI Machine Learning Repository.
Chaque ligne représente une entité de production. Les variables sont des mesures issues de capteurs ou de points du processus. Les étiquettes indiquent si l’entité réussit (1) ou échoue (-1) au test.
Le jeu de données est chargé et disponible sous uci_secom. La variable target correspond à la colonne 'Pass/Fail'. Utilisez les méthodes .value_counts() et .describe() pour inspecter cette variable. Qu’observez-vous ?
Cet exercice fait partie du cours
Méthodes d’ensemble en Python
Exercice interactif pratique
Passez de la théorie à la pratique avec l’un de nos exercices interactifs
Commencer l’exercice