Diese Übung ist Teil des Kurses
In diesem Kapitel werden Klassifikationsprobleme vorgestellt und du erfährst, wie du sie mit Techniken des überwachten Lernens lösen kannst. Du lernst, wie du Daten in Trainings- und Testmengen aufteilst, ein Modell anpasst, Vorhersagen erstellst und die Genauigkeit auswertest. Du entdeckst den Zusammenhang zwischen der Komplexität und Leistung von Modellen und wendest das Gelernte auf einen Beispieldatensatz an, um die mögliche Abwanderung von Kunden eines Telekommunikationsunternehmens vorherzusagen.
In diesem Kapitel lernst du die Vorgehensweise bei der Regression kennen und erstellst Modelle zur Vorhersage von Umsätzen anhand eines Datensatzes zu Werbeausgaben. Dabei wendest du die lineare Regression an und nutzt gängige Leistungskennzahlen wie das Bestimmtheitsmaß und den RMSE-Wert. Außerdem führst du eine k-fache Kreuzvalidierung durch und regularisierst Regressionsmodelle, um das Risiko einer Überanpassung zu verringern.
Nachdem du verschiedene Modelle trainiert hast, lernst du jetzt, wie du ihre Leistung bewerten kannst. Dazu werden in diesem Kapitel verschiedene Kennzahlen und ein Visualisierungsverfahren vorgestellt, um die Ergebnisse von Klassifikationsmodellen mit scikit-learn auszuwerten. Außerdem geht es um die Optimierung von Hyperparametern, um dadurch die Leistung von Klassifikations- und Regressionsmodellen weiter zu verbessern.
In diesem Kapitel lernst du, wie du fehlende Werte korrigierst, kategoriale Daten in numerische Werte umwandelst, Daten skalierst, mehrere Modelle für überwachtes Lernen gleichzeitig auswertest und Pipelines zur Workflow-Optimierung erstellst.
Aktuelle Übung