Fitten en voorspellen voor regressie
Nu je hebt gezien hoe lineaire regressie werkt, is het jouw taak om een multiple lineaire regressie te maken met alle features in de gegevensset sales_df, die al voor je is ingeladen. Ter herinnering: dit zijn de eerste twee rijen:
tv radio social_media sales
1 13000.0 9237.76 2409.57 46677.90
2 41000.0 15886.45 2913.41 150177.83
Vervolgens gebruik je dit model om de sales te voorspellen op basis van de waarden van de testfeatures.
LinearRegression en train_test_split zijn al voor je ingeladen uit hun respectieve modules.
Deze oefening maakt deel uit van de cursus
Supervised Learning met scikit-learn
Oefeninstructies
- Maak
X, een array met de waarden van alle features insales_df, eny, met alle waarden uit de kolom"sales". - Instantieer een lineair regressiemodel.
- Fit het model op de trainingsdata.
- Maak
y_preddoor voorspellingen voorsaleste doen met de testfeatures.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Create X and y arrays
X = sales_df.____("____", axis=____).____
y = sales_df["____"].____
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)
# Instantiate the model
reg = ____
# Fit the model to the data
____
# Make predictions
y_pred = reg.____(____)
print("Predictions: {}, Actual Values: {}".format(y_pred[:2], y_test[:2]))