LoslegenKostenlos starten

Erkundung der UCI-SECOM-Daten

Zum Abschluss dieses Kapitels und um dein Verständnis von Bagging zu festigen, arbeitest du jetzt mit einem neuen Datensatz! Diese Daten stammen aus einem Herstellungsprozess für Halbleiter und wurden aus dem UCI Machine Learning Repository übernommen.

Jede Zeile steht für eine Produktionseinheit. Die Features sind Messwerte von Sensoren oder Punkten im Prozess. Die Labels geben an, ob die Einheit den Test besteht (1) oder durchfällt (-1).

Der Datensatz ist geladen und als uci_secom verfügbar. Die Variable target ist die Spalte 'Pass/Fail'. Verwende die Methoden .value_counts() und .describe(), um diese Variable zu überprüfen. Was fällt dir auf?

Diese Übung ist Teil des Kurses

<Kurs>Ensemble-Methoden in Python</Kurs>
Kurs ansehen

Interaktive praktische Übung

Verwandle Theorie mit einer unserer interaktiven Übungen in die Praxis

Übung starten