1
Klassifikation
Kostenlos
In diesem Kapitel lernst du Klassifikationsprobleme kennen und erfährst, wie du sie mit überwachten Lerntechniken lösen kannst. Du lernst, wie du Daten in Trainings- und Testgruppen aufteilst, ein Modell anpasst, Vorhersagen machst und die Genauigkeit auswertest. Du entdeckst den Zusammenhang zwischen Modellkomplexität und Leistung und wendest das Gelernte auf einen Abwanderungsdatensatz an, in dem du den Abwanderungsstatus der Kunden eines Telekommunikationsunternehmens klassifizierst.
2
Regression
In diesem Kapitel wirst du in die Regression eingeführt und erstellst Modelle zur Vorhersage von Umsatzwerten anhand eines Datensatzes über Werbeausgaben. Du lernst die Mechanismen der linearen Regression und gängige Leistungskennzahlen wie das Bestimmtheitsmaß und die Quadratwurzel des mittleren quadratischen Fehlers kennen. Du führst eine k-fache Kreuzvalidierung durch und wendest die Regularisierung auf Regressionsmodelle an, um das Risiko einer Überanpassung zu verringern.
3
Feinabstimmung deines Modells
Nachdem du Modelle trainiert hast, lernst du jetzt, wie du sie auswerten kannst. In diesem Kapitel lernst du verschiedene Metriken und eine Visualisierungstechnik kennen, um die Leistung von Klassifikationsmodellen mit scikit-learn zu analysieren. Außerdem lernst du, wie du Klassifikations- und Regressionsmodelle mithilfe von Hyperparameter-Tuning optimierst.
4
Vorverarbeitung und Pipelines
Lerne, wie du fehlende Werte ausgleichst, kategoriale Daten in numerische Werte umwandelst, Daten skalierst, mehrere überwachte Lernmodelle gleichzeitig auswertest und Pipelines erstellst, um deinen Workflow zu optimieren!

Initializing

Kreuzvalidierung für Bestimmtheitsmaß

Die Kreuzvalidierung ist ein wichtiger Ansatz, um ein Modell zu bewerten. Sie maximiert die Menge der Daten, die dem Modell zur Verfügung stehen, da das Modell mit allen verfügbaren Daten nicht nur trainiert, sondern auch getestet wird.

In dieser Übung erstellst du ein lineares Regressionsmodell und bewertest dann mithilfe einer 6-fachen Kreuzvalidierung seine Genauigkeit bei der Vorhersage von Umsätzen durch Werbeausgaben in sozialen Medien. Du wirst die individuelle Punktzahl für alle sechs Teilmengen anzeigen.

Der Datensatz sales_df wurde in y für die Zielvariable und X für die Merkmale aufgeteilt und für dich vorgeladen. LinearRegression wurde von sklearn.linear_model importiert.

Importiere KFold und cross_val_score.
Erstelle kf, indem du KFold() aufrufst und die Anzahl der Splits auf 6, shuffle auf True und einen Seed von 5 setzt.
Führe eine Kreuzvalidierung mit reg auf X und y durch und übergib kf an cv.
Drucke die cv_scores.