Aan de slagGa gratis aan de slag

De UCI SECOM-data verkennen

Om dit hoofdstuk af te ronden en je begrip van bagging te versterken, ga je aan de slag met een nieuwe gegevensset! Deze data komt uit een halfgeleiderproductieproces en is afkomstig uit de UCI Machine Learning Repository.

Elke rij staat voor een productie-eenheid. De features zijn metingen van sensoren of punten in het proces. De labels geven aan of de eenheid de test haalt (1) of zakt (-1).

De gegevensset is voor je ingeladen als uci_secom. De target-variabele is de kolom 'Pass/Fail'. Gebruik de methoden .value_counts() en .describe() om deze variabele te bekijken. Wat valt je op?

Deze oefening maakt deel uit van de cursus

Ensemblemethoden in Python

Cursus bekijken

Praktische interactieve oefening

Zet theorie om in actie met een van onze interactieve oefeningen.

Begin met trainen