Anpassung und Vorhersagen bei der Regression
Nachdem du gesehen hast, wie die lineare Regression funktioniert, ist es nun deine Aufgabe, ein Modell für die multiple lineare Regression mit allen Merkmalen des sales_df
-Datensatzes zu erstellen, der in der Konsole schon geladen ist. Zur Erinnerung sind hier nochmal die ersten beiden Zeilen:
tv radio social_media sales
1 13000.0 9237.76 2409.57 46677.90
2 41000.0 15886.45 2913.41 150177.83
Dieses Modell verwendest du dann, um die Umsätze anhand der Werte der Testmerkmale vorherzusagen.
LinearRegression
und train_test_split
wurden bereits aus ihren jeweiligen Modulen geladen.
Diese Übung ist Teil des Kurses
Überwachtes Lernen mit scikit-learn
Anleitung zur Übung
- Erstelle
X
als Array mit den Werten aller Merkmale insales_df
sowiey
mit allen Werten aus der Spalte"sales"
. - Instanziiere ein Modell für die lineare Regression.
- Passe das Modell an die Trainingsdaten an.
- Erstelle
y_pred
mit den vorausgesagten Werten fürsales
anhand der Testmerkmale.
Interaktive Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
# Create X and y arrays
X = sales_df.____("____", axis=____).____
y = sales_df["____"].____
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)
# Instantiate the model
reg = ____
# Fit the model to the data
____
# Make predictions
y_pred = reg.____(____)
print("Predictions: {}, Actual Values: {}".format(y_pred[:2], y_test[:2]))