Ajustement et prédiction de la régression
Maintenant que vous avez vu comment fonctionne la régression linéaire, votre tâche consiste à créer un modèle de régression linéaire multiple en utilisant toutes les caractéristiques de l’ensemble de données sales_df
, qui a été préchargé pour vous. Pour rappel, voici les deux premières lignes :
tv radio social_media sales
1 13000.0 9237.76 2409.57 46677.90
2 41000.0 15886.45 2913.41 150177.83
Vous utiliserez ensuite ce modèle pour prédire les ventes en fonction des valeurs des caractéristiques de test.
LinearRegression
et train_test_split
ont été préchargés pour vous à partir de leurs modules respectifs.
Cet exercice fait partie du cours
Apprentissage supervisé avec scikit-learn
Instructions
- Créez
X
, un tableau contenant les valeurs de toutes les caractéristiques desales_df
, ety
, contenant toutes les valeurs de la colonne"sales"
. - Instanciez un modèle de régression linéaire.
- Ajustez le modèle aux données d’apprentissage.
- Créez
y_pred
, en faisant des prédictions poursales
à l’aide des caractéristiques de test.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Create X and y arrays
X = sales_df.____("____", axis=____).____
y = sales_df["____"].____
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)
# Instantiate the model
reg = ____
# Fit the model to the data
____
# Make predictions
y_pred = reg.____(____)
print("Predictions: {}, Actual Values: {}".format(y_pred[:2], y_test[:2]))