Explorer les données UCI SECOM
Pour conclure ce chapitre et consolider votre compréhension du bagging, il est temps de travailler avec un nouveau jeu de données ! Ces données proviennent d’un processus de fabrication de semi-conducteurs, issues du UCI Machine Learning Repository.
Chaque ligne représente une entité de production. Les variables sont des mesures issues de capteurs ou de points du processus. Les étiquettes indiquent si l’entité réussit (1) ou échoue (-1) au test.
Le jeu de données est chargé et disponible sous uci_secom. La variable target correspond à la colonne 'Pass/Fail'. Utilisez les méthodes .value_counts() et .describe() pour inspecter cette variable. Qu’observez-vous ?
Cet exercice fait partie du cours
<cours>Méthodes d’ensemble en Python</cours>Exercice interactif pratique
Transformez la théorie en action avec l’un de nos exercices interactifs
Commencer l’exercice