Erkundung der UCI-SECOM-Daten
Zum Abschluss dieses Kapitels und um dein Verständnis von Bagging zu festigen, arbeitest du jetzt mit einem neuen Datensatz! Diese Daten stammen aus einem Herstellungsprozess für Halbleiter und wurden aus dem UCI Machine Learning Repository übernommen.
Jede Zeile steht für eine Produktionseinheit. Die Features sind Messwerte von Sensoren oder Punkten im Prozess. Die Labels geben an, ob die Einheit den Test besteht (1) oder durchfällt (-1).
Der Datensatz ist geladen und als uci_secom verfügbar. Die Variable target ist die Spalte 'Pass/Fail'. Verwende die Methoden .value_counts() und .describe(), um diese Variable zu überprüfen. Was fällt dir auf?
Diese Übung ist Teil des Kurses
Ensemble-Methoden in Python
Interaktive Übung
In dieser interaktiven Übung kannst du die Theorie in die Praxis umsetzen.
Übung starten