Kreuzvalidierung für Bestimmtheitsmaß
Die Kreuzvalidierung ist ein wichtiger Ansatz, um ein Modell zu bewerten. Sie maximiert die Menge der Daten, die dem Modell zur Verfügung stehen, da das Modell mit allen verfügbaren Daten nicht nur trainiert, sondern auch getestet wird.
In dieser Übung erstellst du ein lineares Regressionsmodell und bewertest dann mithilfe einer 6-fachen Kreuzvalidierung seine Genauigkeit bei der Vorhersage von Umsätzen durch Werbeausgaben in sozialen Medien. Du wirst die individuelle Punktzahl für alle sechs Teilmengen anzeigen.
Der Datensatz sales_df
wurde in y
für die Zielvariable und X
für die Merkmale aufgeteilt und für dich vorgeladen. LinearRegression
wurde von sklearn.linear_model
importiert.
Diese Übung ist Teil des Kurses
Überwachtes Lernen mit scikit-learn
Anleitung zur Übung
- Importiere
KFold
undcross_val_score
. - Erstelle
kf
, indem duKFold()
aufrufst und die Anzahl der Splits auf 6,shuffle
aufTrue
und einen Seed von5
setzt. - Führe eine Kreuzvalidierung mit
reg
aufX
undy
durch und übergibkf
ancv
. - Drucke die
cv_scores
.
Interaktive Übung zum Anfassen
Probieren Sie diese Übung aus, indem Sie diesen Beispielcode ausführen.
# Import the necessary modules
from ____.____ import ____, ____
# Create a KFold object
kf = ____(n_splits=____, shuffle=____, random_state=____)
reg = LinearRegression()
# Compute 6-fold cross-validation scores
cv_scores = ____(____, ____, ____, cv=____)
# Print scores
print(____)