Erkundung der UCI-SECOM-Daten
Zum Abschluss dieses Kapitels und um dein Verständnis von Bagging zu festigen, arbeitest du jetzt mit einem neuen Datensatz! Diese Daten stammen aus einem Herstellungsprozess für Halbleiter und wurden aus dem UCI Machine Learning Repository übernommen.
Jede Zeile steht für eine Produktionseinheit. Die Features sind Messwerte von Sensoren oder Punkten im Prozess. Die Labels geben an, ob die Einheit den Test besteht (1) oder durchfällt (-1).
Der Datensatz ist geladen und als uci_secom verfügbar. Die Variable target ist die Spalte 'Pass/Fail'. Verwende die Methoden .value_counts() und .describe(), um diese Variable zu überprüfen. Was fällt dir auf?
Diese Übung ist Teil des Kurses
<Kurs>Ensemble-Methoden in Python</Kurs>Interaktive praktische Übung
Verwandle Theorie mit einer unserer interaktiven Übungen in die Praxis
Übung starten