Erste SchritteKostenlos loslegen

Kreuzvalidierung für Bestimmtheitsmaß

Die Kreuzvalidierung ist ein wichtiger Ansatz, um ein Modell zu bewerten. Sie maximiert die Menge der Daten, die dem Modell zur Verfügung stehen, da das Modell mit allen verfügbaren Daten nicht nur trainiert, sondern auch getestet wird.

In dieser Übung erstellst du ein lineares Regressionsmodell und bewertest dann mithilfe einer 6-fachen Kreuzvalidierung seine Genauigkeit bei der Vorhersage von Umsätzen durch Werbeausgaben in sozialen Medien. Du wirst die individuelle Punktzahl für alle sechs Teilmengen anzeigen.

Der Datensatz sales_df wurde in y für die Zielvariable und X für die Merkmale aufgeteilt und für dich vorgeladen. LinearRegression wurde von sklearn.linear_model importiert.

Diese Übung ist Teil des Kurses

Überwachtes Lernen mit scikit-learn

Kurs anzeigen

Anleitung zur Übung

  • Importiere KFold und cross_val_score.
  • Erstelle kf, indem du KFold() aufrufst und die Anzahl der Splits auf 6, shuffle auf True und einen Seed von 5 setzt.
  • Führe eine Kreuzvalidierung mit reg auf X und y durch und übergib kf an cv.
  • Drucke die cv_scores.

Interaktive Übung zum Anfassen

Probieren Sie diese Übung aus, indem Sie diesen Beispielcode ausführen.

# Import the necessary modules
from ____.____ import ____, ____

# Create a KFold object
kf = ____(n_splits=____, shuffle=____, random_state=____)

reg = LinearRegression()

# Compute 6-fold cross-validation scores
cv_scores = ____(____, ____, ____, cv=____)

# Print scores
print(____)
Bearbeiten und Ausführen von Code